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Capítulo 1 


Conceitos Básicos 


1.1 Introdução 


Pretendemos neste capítulo relembrar alguns conceitos básicos, que irão facilitar a compreensão dos 
métodos numéricos apresentados nos próximos capítulos. A maioria dos conceitos aqui apresentados são 
de álgebra linear e isso se deve ao fato de que os resultados da álgebra linear, em geral, e da teoria 
dos espaços vetoriais, em particular, na análise numérica é tão grande, que estudo pormenorizado desses 
assuntos cada vez mais se justifica. Assim maiores detalhes sobre os assuntos aqui abordados podem ser 
encontrados em livros de álgebra linear. 

Para iniciar vamos examinar dois conjuntos que certamente já são conhecidos do leitor. O primeiro é 
o conjunto dos vetores da geometria, definidos através de segmentos orientados, e o outro é o conjunto 
das matrizes reais m X n. 

À primeira vista pode parecer que tais conjuntos não possuem nada em comum. Mas não é bem assim 
conforme mostraremos a seguir. 

No conjunto dos vetores está definida uma adição dotada das propriedades comutativa, associativa, 
além da existência do elemento neutro (vetor nulo) e do oposto. 

Além disso, podemos multiplicar um vetor por um número real. Essa multiplicação tem as seguintes 
propriedades (já certamente vista por você no seu curso): 


alu+v) = au+av, 
(a+p)ju = au+ pu, 
(aju = (apu), 
l-u = u, 


onde u, v são vetores e q, / são escalares quaisquer. 

No conjunto das matrizes também está definida uma adição dotada também das propriedades associ- 
ativa, comutativa, admite elemento neutro, a matriz nula, e toda matriz tem uma oposta. 

Como vemos o comportamento do conjunto dos vetores e o das matrizes quanto à adição é o mesmo. 
Mas não param por aí as coincidências. 

Pode-se também multiplicar uma matriz por um número real. Essa multiplicação apresenta as mesmas 
propriedades que as destacadas para o caso de vetor, ou seja, valem as seguintes igualdades: 


a(A+B) = aA+aB, 
(a+B)A = aA+BA, 
(aB)A = (84), 
1.4 = A 


b) 
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onde A, B são matrizes e q, 8 são escalares quaisquer. 

Logo o conjunto dos vetores e o das matrizes apresentam uma certa coincidência estrutural no que 
se refere a um par importante de operações definidas sobre eles. Nada então mais lógico que estudar 
simultaneamente o conjunto dos vetores, das matrizes e todos os conjuntos que apresentem a mesma 
estrutura acima apontada. 


1.2 Espaço Vetorial 


Seja E um conjunto e seja K um corpo. Suponhamos que em E esteja definida uma operação de 
adição: 
(z,y) EExE >x+yEE, 


e que esteja definida uma operação entre os elementos de K e os elementos de E (chamada multiplicação 
por escalar): 


(gra) EKxXxE > areE. 


Então E é um K-espaço vetorial, em relação a essas operações, se as seguintes condições estiverem 
satisfeitas: 


Ay) (pg) a = x+ (y +2), Vry, ZEE, 
A) z+y = y+r, Yr, yEE, 

As) 3O(zero) EE/x+0 = xz, EE, 

Ay) YxeEeE, 3-—-xrEE/zr+(-r) = 0, 

Mı) a(x+y) = ar+ay, Ya € K, Vi, ye E, 
Mə) (a+b)u = az+ br, Va,BeK, Vive E, 
M3) (aß)x = (abr), VaBeK, Vxe E, 

M4) 1x =2,Vz7eEÊ. 


O leitor deverá lembrar-se sempre de que, na definição acima, não se especifica nem a natureza dos 
vetores nem das operações. Assim qualquer conjunto que satisfaça as oito condições acima especificada 
será um espaço vetorial. 


Definição 1.1 - Seja E um K-espaço vetorial. Os vetores vy,va,...,vp E E são linearmente depen- 
dentes sobre K, se existem escalares 01,09,...,ay E K, nem todos nulos, tais que: 
av + Q2 V2 +...+t Qk vp = O. 
Observamos que essa relação é sempre válida se os a;, i = 1,2,...,k são todos iguais a zero. Nesse 


caso dizemos que os vetores são linearmente independentes. 


Definição 1.2 - Um K-espaço vetorial tem dimensão n se: 
a) existem n vetores linearmente independentes; 


b) (n + 1) vetores são sempre linearmente dependentes. 


Definição 1.3 - Qualquer conjunto de n vetores linearmente independentes é chamado base de um 
K-espaço vetorial de dimensão n. 


Assim, qualquer vetor do espaço pode ser representado como combinação linear dos vetores da base. 


Mudança de Base 
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Estudaremos inicialmente mudança de base em um espaço vetorial bi-dimensional, e a seguir, em um 
espaço de dimensão n. 


a) Seja E= IR2. Sejam Bı = fe,,e>) uma base de E e v € E, como mostrados na Figura 1.1. 


a12 e vi a11 


Figura 1.1 


Então v se exprime de maneira única como combinação linear dos elementos de Bı, isto é, existem 
escalares v1, v2 (elementos de K) tais que: 


V = ve +gves, (1.1) 


(onde os escalares v1, v2 são as coordenadas de v na base B1). 
Seja Bj = (e4,e5), como mostrado na Figura 1.1, uma outra base de E. Analogamente, podemos 
escrever: 
v = vi e} + mea. (1.2) 


Desejamos saber como, dadas as coordenadas de v na base Bı (aqui denominada base antiga), 
poderemos determinar as coordenadas de v na base Bi (aqui denominada base nova). Sendo ej, e% 
elementos de E podemos, em particular, escrever cada um deles como combinação linear dos elementos 
da base Bı. Assim: 

e1 = Ôme+anes, 


(1.3) 


1 
€ = Q12 €11 T Q22 €2. 


isto é, cada vetor da base nova se exprime de maneira única como combinação linear dos vetores da base 
antiga. 


Assim, em virtude de (L1), e temos: 


v = ve + Ve: = v el + ves 
= rd JÁ 
= v (am e1 + ag e2) + uv, (aiz er + a22 e2) 
o d £ , 1 
= (vi a + wa) e1 + (vi a21 + va») e. 


Como as coordenadas de um vetor em relação a uma determinada base são únicas, podemos igualar 
os coeficientes. Assim, obtemos o sistema linear: 


1 1 

Vi = Vi di T V Q12 
pae F 1 

U = vi üz T Vs a22 
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tio) vs 
U2 421 Q22 va 


v = Av. (1.5) 


ou na forma matricial: 


ou ainda: 


O sistema (1.4), possui sempre uma e uma só solução v, vs, pelo fato de Bı e B{ serem bases de E. 
Então, conhecidas, na base antiga, as coordenadas v1, vz de v e as coordenadas de cada um dos vetores 
e4,e4, na base antiga, podemos determinar as coordenadas v, v, de v na base nova usando (1.4). 
Sendo A não singular, (det(A) £ 0), existe a inversa A! de A. Assim, pré-multiplicando (1.5) por 
A-1, obtemos: 
vV = Ao. (1.6) 


A equação matricial (1.6) mostra como calcular as coordenadas de v na base antiga quando conhecidas 
as coordenadas de v na base nova. 


Exemplo 1.1 - Seja v = (2,4)! na base f(1,2)*, (2,3). Calcular as coordenadas de v na base ((1,3)*, (1, 4). 


Solução: De (1.3), temos: 
(1,3) = 011 (1,2)* + 4921 (2,3) , 
(1,4) — a12 (1,2)* + 4992 (2,3) e 


Da primeira equação, obtemos o sistema: 


1 Hii T 2 a21 = 1 


2 ail + 3a2 = 3 
cuja solução é: a11 = 3, a21 = —1. De maneira análoga, da segunda equação, obtemos: 
1 ao + 20492 = 1 
2 ai2 + 3499 = 4 
cuja solução é: a12 = 5, a22 = —2. Substituindo os valores conhecidos em (1.4), segue que: 


2. 3 5 vi 
E a -2 uv) 
cuja solução é: vi = 24, v4 = —14. Assim, v = (24,14)! na base ((1,3)*, (1,4)'). 


Veremos agora, mudança de base em um K-espaço vetorial E de dimensão n. 


b) Seja E = IR”. Sejam {e1,€2,..., en}, Lle1,65,...,el,) bases de E ev € E. Então, podemos 
escrever: 


n n 
EAN E 
v = ) Vie; = Uj €j 
i=1 j=1 
Mas e4,64,...,e; são elementos de E, e portanto podem ser expressos em relação a base (e1,€2,...,en+. 


Logo: 


n 

, ; 

e; = ) Gyér çs j=1,2,...,n. 
i=1 
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Então temos: 


II 
Ms 

A 
S. x~ 
RE S 
M- 

Q 

$ 

N 
Nia, 

II 
EA 
M 

2 

S 

2 

B 

S 

S 

l 
M: 

Q 

S 

S 
= 


uv Q11 12 Ain Ui 
1 
U2 a21 Q22 Adm U2 
1 
Un Ant An2 Ann Un 
ou 
v = Av e v = Av. 
2 . 
Exercícios 


1.1 - Seja v = (2, 3, 4)* na base canônica, isto é, na base: 
{(1, 0, 0)*, (0, 1, 0) , (0, 0, 1%}. 
Calcular as coordenadas de v na base: 


(ADS (1, 1, 0% , (1,0, 0)). 


1.2 - Seja v = 3 bı + 4 b2 + 2 bz, onde: 
bı = (1, 1, 0) , b2 = (—1, 1, 0) , ba = (0, 1, 1). 
Calcular as coordenadas de v na base: 


fi= (1; 1, 1)* , fr=(1, 1, 0), f= (1, 0, 0)! š 


1.3 - Seja Kn(x) = {P,(x) / r < n} o espaço vetorial de todos os polinômios de grau < n. A base 
canônica para o espaço dos polinômios é {1, x, x?, ...}. Seja P = 3+4 x? +2 x? e Bj= 
{5, x— 1, x? — 5x +3, x? — 4} uma outra base. Calcular as coordenadas de P3 em relação à base Br. 


1.4 - Sejam Bı = {5, x — 1, x? — 3 xz} e Ba = {8, 3 x +2,5 x? — 3 x) bases de Ks(x). Seja 
Po(x) = 8{5} + 4x — 1} + 3{x? — 37). Calcular as coordenadas de P2(x) em relação à base Bə. 


1.5 - Dado o polinômio P(x) = 20 x? +8 x? — 14 x +28 exprimílo como combinação linear dos 
polinômios da sequência: 


Q(x) =5 xz? —7 z+ 12, 
Qo(x) = —4 z? +8 2, 
Qıl) =6x-1, 

Qo(x) = 5. 


Espaço Vetorial Euclidiano 


Vamos definir aqui importantes noções de produto escalar e de ortogonalidade, visando introduzir, 
entre outras coisas o conceito de comprimento e distância. 


Produto Escalar 


Seja E um espaço vetorial real. Sejam x,y elementos de E. 
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Definição 1.4 - Chama-se produto escalar (ou produto interno) de x por y, em símbolo, (x,y), 
qualquer função definida em E x E com valores em IR satisfazendo as seguintes propriedades: 


) (x,y) = (Wa), Voye E, 
Po) (v+92) = (2,2) + (92), Yzy, ZEE, 
) (x,x) > 0e(x,x) = 0 see somente se x = (nulo). 


Um espaço vetorial real E, onde está definido um produto escalar é chamado espaço euclidiano real. 


Daremos a seguir alguns exemplos de produto escalar. 
Exemplo 1.2 - Seja E = IR?. Sejam x = (x1, £2)*; y = (y1, y2). Mostrar que, definindo: 
(x,y) = t1 Yı + toy. (1.7) 
o IR? torna-se um espaço euclidiano real. 


Solução: Devemos mostrar que as condições Pı, P2, P e P4 estão satisfeitas, isto é, que é um 
produto escalar bem definido no IR?. De fato: 


P,) (x,y) = T1Yı + T2Y2 = Y1T1 + Y2T2 = (ya). 
P) (£x+y,z) = (xı +y1)z1 + (z2 + y2)z2 = £121 + Y121 + T222 + Y222 
= (mm + £222) + (nz + y222) = (£, z) + (y, z). 


P) (Axy) = Ary + Az2y2 = Ay + xoyo) = A(x, y). 
P4) (z,£) = zî +r > 0 (evidente). 
(xo) = r? +r =08 r? =0% ri 0, V; r=9. 


Logo, (1.7) é uma boa definição de produto escalar. 


Nos próximos exemplos, a verificação de que as condições Pı, P2, P e P4 são satisfeitas, fica como 
exercício. 


t 


Exemplo 1.3 - Seja E = IR”. Para x,y E€ E, isto é, x = (£1, £2, ..., En) , € Y= (Y1, Y2, ---, Yn)’, 


definimos: 
(my) = Ñ` miyi, (1.8) 
i=1 


como um produto escalar no IR”. FE) é chamado de produto escalar usual no IR”. Também, 
n 
(2,9) = 5 Wi Ti Yi, (1.9) 
i=1 


com w; fixados e positivos, define no IR” um produto escalar. 
Assim, tanto (1.8) como (1.9) transformam o IR” num espaço euclidiano real. 


Exemplo 1.4 - Seja E = Cla,b] o espaço vetorial das funções contínuas reais definidas sobre o intervalo 
limitado fechado [a,b]. Se para f,g € Cla,b] definimos: 


b 
(1,9) = f f(x) gla)de, (1.10) 


tal espaço torna-se um espaço euclidiano real. é chamado de produto escalar usual em Cla, b]. 
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Em a se f(x) = P(x) e g(x) = Pj(x), com < n, são polinômios de grau < n, a 


k, 
equação define um produto escalar em K, = {P,(x) e < n}, (espaço vetorial dos polinômios de 
grau < nje 


Exemplo 1.5 - Seja E = Kn (x£) = (Px) /r <n}. Sejam a< zo < zı <... < £m <b, m+1 pontos 
distintos, com m > n. Definimos: 


(Pla), P;(2)) = Y P; (2x) P; (2r). (1.11) 


como um produto escalar Kn. 


Esse último exemplo mostra uma outra maneira de se transformar K, (x) num espaço euclidiano real, 
maneira esta que será útil em problemas de aproximação de funções pelo método dos mínimos quadrados, 
no caso discreto. 


Ortogonalidade 


Seja E um espaço euclidiano real. Sejam x,y elementos de E. 
Definição 1.5 - Dizemos que x é ortogonal a y, em símbolo, x L y, se e somente se (x,y) = 0. 
Observe que (1,0) = (0, x) = O qualquer que seja x, onde 0 é o vetor nulo. 


Exemplo 1.6 - No espaço E = C[-7,7], com (f,9) = f(z ) dz, verificar se sen x ecos x são 
ortogonais. 


Solução: Temos: 
T 
sen? x 


(sen a.cos a) = f sen x cosa dz = 7 | = 0. 


== 


Assim, sen x e cos x são ortogonais em E. 


3- 
w 
E 
w 
io ad 
A 


Exemplo 1.7 - Em E = IR?, com o produto escalar usual, verificar se os vetores: fi = ( 
t 
e f2 = (3 i S 0) são ortogonais. 


Solução: Temos: 


(fo f2) = ( 5) + = x 0 


Logo, fi e f2 são ortogonais em E. 


Teorema 1.1 - Os vetores vy,v3,...,Um tais que: 


a) vAtOi=1,2..,m; 
b) (v,v;j) = 0, parai £ j; 


são sempre linearmente independentes. 
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Dito de outro modo:os vetores não nulos vi, v2,..., Um, dois a dois ortogonais, são sempre linearmente 
independentes. 
Prova: Devemos provar que: 


avi + avo +... + âmim = 0 (1.12) 
Qj Q2 ... Qm 0. 
Em virtude de (1.12) podemos escrever, sucessivamente, para cada į = 1,2,...,m: 
(vi , Qv + Qv +... + au; +...4 AmUm) = (vi, 0) = 0, 
ou seja: 
Qy (vv) + as(vivo) +... + Qi(vi vi) +... + am (Vi, Um) = 0. 
onde aplicamos P e P3. Mas (v;,v;) = 0 , i Æ j. Daí, a igualdade acima se reduz a: 
ai (vi vi) = 0 
Mas sendo v; Æ 6, temos, usando P,, que (vi, vi) £ 0, para i = 1,2,...,m. Portanto, da última 


igualdade concluímos que, 
Qi = 0, i = 1,2,..., mM. 


Logo, os vetores vi, v2,..., Um São linearmente independentes. 


Definição 1.6 - Seja E um espaço euclidiano de dimensão n. Se fı, f2,..., fn são dois a dois ortogonais, 
ou seja, se (fi, fi) = 0, à £ j, eles constituem uma base de E, que será chamada de base ortogonal. 


Teorema 1.2 - A condição necessária e suficiente para que um vetor v E€ E seja ortogonal a um sub- 
espaço E' C E é que v seja ortogonal a cada vetor e1,e2,...,en de uma base de E”. 


Prova: A condição é evidentemente necessária. Provemos a suficiência. Seja x um vetor qualquer de 
E". Temos então: 


v = qe + a2e9 +... + Qn Cn, 
desde que e1,€2,...,en é uma base de E’. Devemos mostrar que v L x. Assim: 
(v,x) = (v, we + aze +...+ Qn en) 


= (vei) + as(v,eo) +...+t an(v,en) = 0, 
desde que por hipótese, v L fer,e2,...,ent. Logo v é ortogonal a E”. 
Teorema 1.3 - Num espaço euclidiano real E quaisquer que sejam x,y E€ E, temos: 
(x,y)? < (x,2) (9,9), (1.13) 
com igualdade válida se e somente se x e y são linearmente dependentes. 


A desigualdade (1.13) é chamada desigualdade de Schwarz. 


Prova: Tomemos o vetor v = x + À y, onde À é um número real qualquer. De P,, resulta: 
(r+àysr+ày) >20, 


e usando P> e P3, obtemos: 
A? (yy) + 2A(£,y) + (2,2) > 0. 
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Para que o trinômio seja sempre > 0 é necessário que A < 0. Assim: 


A = 4(x,y)? = 4(x,x)(y, y) < 0, 
> (x,y)? < (x,x)(y,y). 


Mostremos agora que a igualdade é válida se e somente se x e y são linearmente dependentes. Seja 
x = Ay. Então: 


| 


(x,y)? = (Ayy)? = Aly, y)? = ày, y) 
My yyy) = (Ay, Ay) (y, y) 


Suponhamos, agora que a igualdade seja válida em (1.13). O caso y = 0 é trivial. Suponhamos y Æ 0. 
Temos que (x,y)? = (x, x)(y, y) é equivalente a: 


(x + AyztAy) = 0 com à = — (zy) 


Assim, de P4, concluímos que x + A y = 0. Ou seja x = e y, e isto quer dizer que x e y são 
linearmente dependentes. 


Exercícios 


1.6 - Em relação ao produto escalar usual do IRÊ, calcule (x,y) nos seguintes casos: 
a) t= (1/2, 2, 1) 2 y =R (4, 1, —3*; 
b) z= (2, 1, 0f, y=(4,0, 2); 


1.7 - Determinar (f, g) = I f(t g(t)dt para cada um dos seguintes pares de vetores de Ko(t). 
a) ft) =t, gt)=1-¢; 


b) A =t-3, s=- (t-54) 


1.8 - Sejam x = (x1, £2)* e y = (y1, y2)* dois vetores quaisquer do IR2. Mostre que: 


T1ıT2 yY1y2 
a? b2 o’ 


(2,9) = 
com a,b € IR fixos e não nulos define um produto escalar sobre o IR2. 


1.9 - Considere no espaço vetorial IR? o produto escalar dado por: (x,y) = xıyı + 2x5y>, para todo 
par de vetores x = (a1,12)' ey = (y1, y2) 


. Verificar se x e y são ortogonais em relação a esse produto 
escalar nos seguintes casos: 
a) x= (1, 1) ey=(2, —1)f; 
b) z= (2, 1) e y= (—1, 1); 


b) x= (3, 2) e y= (2, —1)f; 
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1.10 - Determine m de modo que sejam ortogonais os vetores x = (m + 1, 9 e y = (—1, 4)! em 
relação ao produto escalar usual do IR?. 


1.11 - Determinar f(x) € Ko(x) que seja ortogonal a g(x) = 1 e h(x) = t, em relação ao produto 
escalar dado por: 


(1,9) = J Ho) o(a) de. 


1.12 - Considere no IR? o produto escalar usual. Determine m € IR de tal modo que os vetores 
u= (1, m+1, m), v=(m-1, m,m+ 1), sejam ortogonais. 


1.13 - Sejam f(x) = x, g(x) = mz? — 1 e considere o produto escalar usual em C[0,1]. Determine o 
valor de m, para que f(x) e g(x) sejam ortogonais. 
Espaço Vetorial Normado 


Vamos definir agora importantes definições de norma de vetor e de matriz. Com isso estaremos aptos 
a definir, quando oportuno, as noções de limite de uma sequência de vetores ou de matrizes, de grande 
utilidade, entre outros, no estudo de convergência de métodos iterativos de solução de sistemas lineares 
e do problema de erros de arredondamento nos processos de cálculo onde intervêm matrizes ou vetores. 


Norma de Vetor 


Definição 1.7 - Chama-se norma de um vetor x, em símbolo, || x ||, qualquer função definida num 
espaço vetorial E, com valores em IR , satisfazendo as seguintes condições: 


Ny) IIzl>0e ||zl|= 0 see somente sexz = 0, 
Nə) Az] = [A| || || para todo escalar A 
N3) +y] <| «ll +] y| (desigualdade triangular). 
Um espaço vetorial E, onde está definida uma norma é chamado espaço vetorial normado. 


Daremos a seguir alguns exemplos de norma no JR”. 


Exemplo 1.8 - Seja E = IR”, e seja x = (x1,12,...,Xn)'. Mostrar que, definindo: 


(1.14) 


o IR” torna-se um espaço vetorial normado. 


Solução: Vamos mostrar que as condições Ni, Nə e N3 estão satisfeitas, isto é, que (1.14) é uma norma 
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bem definida no IR”. De fato: 


Ni) [le = x? > 0 (evidente). 
Ya 
[sle = 
Nə) Axo = 


2 2 2 2 
N3) lx+y li =X (z; + yi) = (£1 + y1) + (z2 + y2) +... + (En + Yn) 


n n n n 
SL BALLAD wo 
i=1 i=1 N i=1 i=1 
onde usamos a desigualdade de Schwarz, isto é: 
n n n 
Dt SAD AD Uê 
i=1 i=1 i=1 
Portanto, 
le+ylè <lelg +2l2lg yle + iyli 
= (elle + Iy lle). 
Assim: || +y] < (zle + |ylb). Extraindo-se a raiz quadrada de ambos os membros, 
temos que:_|| æ +y ||la < I2 lle + Iyl- 


Logo, (1.14) é uma boa definição de norma. 


No próximo exemplo, a verificação de que as condições N1, No e N3 são satisfeitas, fica como exercício. 


Exemplo 1.9 - Seja E = IR”, e seja x = (£1, £2,...£n)*. Definimos então: 


[o lo = max, [el 


leli= 5 led, 
lal = (=, 


como normas no IR”. 


Observações: 


1) || æ |= (2,2) corresponde à noção intuitiva de comprimento ou módulo de um vetor. 
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2) Se usarmos a definição usual de produto escalar no IR”, isto é, se usarmos (1.8), então: || æ || = 


væ s) = VX vw = |z lz. 
Exemplo 1.10 - Seja x = (—1, 10, 3, 4, —20)*. Calcular || z || g, | x lo e l| æ lla- 


Solução: Aplicando a definição de cada uma das normas, obtemos: 


lele = (D+ (002 + 32? + 4 + (720) ~ 22.93, 
I æ lloo max (|— 1|, |10|, [3]; |4],| — 20|) = 20, 
læ lla |-1 + |10] + || + 4] + |- 20| = 38. 


Como você pode observar a aplicação de cada uma das normas definidas anteriormente fornece um 
resultado diferente. Entretanto, no IR”, todas as normas são equivalentes. 


Definição 1.8 - Duas normas ||- la e ||- | são equivalentes se existem constantes kı e kə tais que: 
kı |æ lla < lll < kl o, YzreE. (1.15) 


Exemplo 1.11 - Como exemplos de normas equivalentes, no IR”, temos: 


a) zlo <les an Izl, 
b) Iel <le le s< va Izla, 


1 
9 alzli<lelos ve el 
Vamos verificar que o item a) é verdadeiro; a verificação das demais fica como exercício. 


Solução: Temos: 


elo = max do) = maxfei], leal- l2nl} 
k—1 n n 
= <a ++ > lel=>/el=Ial 
i=1 i=k+1 i=1 


= |z| + |r2| +...+ x] < (ue + x +... + xl 
n vezes 
= nu) = n max |x| = n xl. 
I<i<n 


Teorema 1.4 - A desigualdade de Schwarz (1.13) pode ser escrita como: 
ey <eloyi. (1.16) 
Prova: A prova deste teorema fica como exercício. 
Um vetor x, de E, é unitário se seu comprimento é igual a 1, isto é, se || x ||= 1. 


Definição 1.9 - Seja E um espaço euclidiano de dimensão n. Os vetores fi, fo,..., fn formam uma 
base ortonormal de E se eles forem vetores ortonormais, ou seja, se: 


1 se i=j, 


Gadi) = dj = ( 0 se 1%93. 
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Assim uma sequência de vetores é ortonormal se cada um dos seus elementos tem norma 1 e dois 
quaisquer distintos dentre eles são ortogonais. 


Teorema 1.5 - Num espaço euclidiano, um conjunto ortornormal de vetores é sempre linearmente in- 
dependente. 


Prova: (análoga ao do Teorema [[.1)). 


Definição 1.10 - Seja E um espaço euclidiano. Dados os vetores x ey € E, definimos distância entre 
x ey, o comprimento do vetor x — y, isto é: 


d(z,y) =I|z-yl> d(z,y) = y(z-y,x- y). 
Temos assim uma aplicação d: Ex E — RR, que satisfaz as seguintes condições: 


Dı) d(x,y) >0e d(x,y) = O see somente se x =y, 
Do) d(x,y) = d(y,x), Voye E, 
Ds) d(x,y) < d(x,z) + d(z,y), Ve,y,z EE. 


Norma de Matriz 


Como já dissemos anteriormente, o conjunto das matrizes (n x n), com as operações de soma de 
matrizes e produto de um escalar por uma matriz forma um espaço vetorial E de dimensão n?. Podemos 
então falar em norma de uma matriz A € E. Observe então que no caso de matrizes, vale a mesma 
definição de norma de vetor , isto é: 


Definição 1.11 - Chama-se norma de uma matriz A, em símbolo, || A ||, qualquer função definida no 
espaço vetorial das matrizes n x n, com valores em IR , satisfazendo as seguintes condições: 


Mı) |4|l> 0e | A|| = Osee somente se A = (matriz nula) , 
Mə) || A A|| = |A| || A|| para todo escalar À, 
Ms) | A4+BI||<| A|| + || B || (desigualdade triangular). 


Daremos a seguir alguns exemplos de norma de matrizes. A verificação de que são normas bem 
definidas no espaço vetorial das matrizes n x n, fica a cargo do leitor. 


Exemplo 1.12 - Seja A uma matriz (n x n). Definimos então: 


n 
a) | Allo = pa 2 jaij| (norma linha) ; 
J= 


n 


b) Alh = us >, la;;) (norma coluna) ; 
= 


(norma euclidiana) . 


Para essas normas vale: || AB ||<|| A |||] B ||- (Prove). 


Exemplo 1.13 - Seja 


3 2 -l1 
A= 6 3 4 
-1 2 1 


Calcular || Allo, || 4ll1, Alle - 


CAPÍTULO 1. CONCEITOS BÁSICOS 14 


Solução: Usando cada uma das definições dadas anteriormente, obtemos: 


Allo = l6] + |3| + 4| = 13, 
Ala = |l+|6+|-1)=10, 
Alla = (94+4+1+36+9+16+1+4+0/2 =9., 


Como no caso de vetor, as normas de matrizes também são equivalentes, isto é, satisfazem uma relação 
do tipo (1.15), com o vetor x substituído pela matriz A. A verificação das desigualdades no próximo 
exemplo fica como exercício. 


Exemplo 1.14 - Como exemplos de normas equivalentes, no espaço vetorial das matrizes de ordem n, 
temos: 


[Alo < I| Ale < vn Alo, 


lAl <ilele < vra llela, 
o) |Alo< n Alho, 


d) |Ali<n Alo. 


SIHSIH 


Definição 1.12 - Dada uma norma de vetor, podemos definir uma norma de matriz, que será chamada 
de subordinada a ela do seguinte modo: 


| = a | Az. 


al|=1 


Observe que a norma de matriz assim definida pode ser interpretada como sendo o comprimento do 
maior vetor no conjunto imagem {Ax} da esfera unitária {xz / || «x ||= 1} pela transformação x > Az. 


Definição 1.13 - Se uma norma de matriz e uma norma de vetor estão relacionadas de tal modo que a 
desigualdade: 
| Az || < AIle ||, 


é satisfeita para qualquer x, então dizemos que as duas normas são consistentes. 

Note que existe um vetor xo tal que: || Ax ||=|| A ||| æ ||. Nestas condições: || A |= mink tal que 
| Ax |< k xl. 
Exercícios 


1.14 - Considere os vetores do R$: x = (1, 2, 0, —1, 2, —10)t e y = (3, 1, —4, 12, 3, 1). Calcule 
a norma de cada um desses vetores usando as normas definidas no exemplo 


1.15 - No espaço vetorial IRt, munido do produto escalar usual, sejam x = (1, 2, 0, 1} ey = 
(8, 1, 4, 2) . Determine: (2,9) [12 lll y ,d(2;9) e FEEL 


1.16 - Prove que num espaço euclidiano normado: 
a) |e +y l? +I æ- y l= 2l] æ IPI +y ||), 


b) Hz = iyisi e- y ll 
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1.17 - Sejam u e v vetores de um espaço euclidiando tais que || ull=1Llvl|=1ellu-v|=-—2. 
Determine (u,v). 


1.18 - Considere as seguintes matrizes: 


2 1 3 41 
ER l 

2i 4 3 8 2 

a=(3 n da ss O o yar 4 

3-1 0 1 


Calcule a norma de cada uma delas usando as normas definidas no exemplo 


1.3 Processo de Gram-Schmidt 


Em diversos problemas relacionados com espaço vetorial, a escolha de uma base para o espaço fica 
a critério da pessoa que se propôs a resolver o problema. É claro que sempre a melhor estratégia será 
escolher a base que melhor simplifique os cálculos. Em espaços euclidianos, tem-se muitas vezes o caso 
em que a melhor escolha da base é aquela onde todos os seus vetores são mutuamente ortogonais ou 
ortonormais. 

Vimos anteriormente que uma sequência ortonormal de vetores é sempre linearmente independente. 
Vamos agora mostrar que é sempre possível construir, a partir de uma sequência de vetores linearmente 


independentes { f1, fo,..., fn}, uma sequência ortogonal {e1, €2,..., €n}. 
Para obtermos uma sequência ortonormal (ej,e3,...,ei+, basta fazer: 
ĉi s 
e = r; S l2 n 
|| es || 


Teorema 1.6 - Todo espaço euclidiano n dimensional tem uma base ortogonal e uma base ortonormal. 


Prova: Todo espaço euclidiano E é um espaço vetorial, e, portanto tem uma base. Seja fi, f2,..., fn 
uma base desse espaço euclidiano. Vamos construir a partir de f1, fo,..., fn uma base ortogonal de E. 
Seja {e1, €2,..., €n} a base procurada. 
Tomamos e, como sendo igual ao primeiro elemento da sequência dada, isto é: 
eg = fi. 


O elemento es será tomado como combinação linear do segundo elemento da sequência dada e e1, ou 
seja: 
e2 = f2 + %6, 


onde q; é escolhido de tal maneira que es seja ortogonal a e1. Assim: (e2,€1) =0 —> (f2 +aı €1,61) = 0. 
Portanto, segue que: 


(f2,e1) 
q = — D+. 
(23564) 
Vamos supor que já temos construído os vetores: e1,€9,...,€k-1, dois a dois ortogonais. O elemento 


ex será tomado como combinação linear do kº elemento da sequência dada e todos os e;, já calculados, 
isto é: 
ex = fkt Qk-1 ek—1 + Qk-2 €k—2 +... +01 61, 
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onde os a;, i = 1,2,...,k — 1, são determinados de tal maneira que e; seja ortogonal a todos os e; já 
calculados. Assim, devemos ter: (er,e;)=0,i = 1,2,...,k-— 1, ou seja: 
(erne) = (fk +ak-1€ek-1 +... + 0161,61) = 0, 
(cerne) = (fk +ak-1€k-1 +... +a161,€2) = 0, 
(ek ern-1) = (fk +ak-1€k-1 +... +a1e1,ek—1) = 0. 
Desde que os vetores e1, €2,...,€ķ—1 foram construídos dois a dois ortogonais, obtemos: 
(esta) + ai (eita) =0, 
(fk €2) + as (e2, e2) = 0, 
(fk e€k-1) + ari (€k-1;,€k-1) = 0. 


Portanto, segue que: 


ar ai (fr, e1) 
(81,64 | 
az = o (fr, e2) 
(e2, e2) ° 
Qk-1 = — (fk, ek—1) 
CER 
Mostremos agora que e; £ 0. De fato, temos que ex é combinação linear dos vetores e1,€e2,...,Ck-1, fk- 
Mas eķ—ı pode ser escrito com combinação linear dos vetores e1,€92,...,€k-2, fk-1 e assim por diante. 
p 7 2 b) 


Então, substituindo, teremos: 
ere=uatfi+açto+...+ axa fra + fk, 


e como fi, fo,..., fk, são linearmente independentes, temos que e * 0; qualquer que seja k. 

Assim, usando e1,€2,...,ek-1 e fr construímos ex. Analogamente com e€1,€2,...,€k € fk+1 cons- 
truímos ex+,1. Continuando o processo, construímos os n vetores dois a dois ortogonais. Assim esses 
vetores formam uma base ortogonal de E. Tomando: 

Ci; j 
Apen t2 


e = 
co ell’ 


teremos uma base ortonormal de E. 
Chama-se processo de Gram-Schmidt a construção passo a passo (descrita na prova do teorema 
para converter uma base arbitrária em base ortogonal. 


Exemplo 1.15 - Construir a partir de 
fı = (1, —2, 0)" » fo = (0, 1, 1) , f3 = (1, 0, —1)*; 


uma sequência de vetores ortonormais ef, 3,3, relativamente ao produto escalar usual do IRÊ, usando o 
processo de Gram-Schmidt. 
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Solução: Temos: 


e1 


e2 


e2 


€3 


€3 
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fi = (1, —2, 0) 
fo + q1e1, onde 
(f2,e1) -2 2 
= = fem => 
S1 (e1,e1) 5 5 
2 2 1 ; 
0, 1, 1) a A N a E E l : 
01) + ga -2o = (5.5.1) 
fs + age» + ares, onde 
(f3, e2) —3/5 o 1 
Q2 = = ; 
(e2, e2) 6/5 2 
(f3,€1) 1 
= = >> 
ss (e1,e1) 5 


Assim e1,€2,€3 são dois a dois ortogonais. Para obtermos a sequência ortonormal eï, e3, e3, fazemos: 


el 


E 
€z 


e3 


Exemplo 1.16 - Dada a sequência de polinômios independentes {1, x, x°} obter, no intervalo [—1,1], 
uma sequência ortogonal de polinômios (Po(x), Pı(x), Pa(x)} relativamente ao produto escalar (f, g) 


Ps fa) o(a) de 


Solução: Temos: 


eae e1 (1, —2, 0)’ o —2 ; 
lel Kee) vE+ are = (vp v5’ o) 

€2 e2 ne a F 1) tr, 5 Dm: E 
lell leze) VEBPHOBPHP vë (651): 

e3 e3 (1, 1/2, = 1/25 “ f2 Ii t 
|| es || = Jea y+ + (1/2 + (1/92 = o (1, J> 12) ; 


1 7 
xz +aoPo(x), onde 
(z, Po(a) feias Dio 
(Polo), Pa) fia € = > 


v+t0x1i = q. 


x +omPi(x) + aoPo(x), onde 


a, PE) Si a do Sal =o, 


(Pl) P(o) fado 2/8]40 


(42, Po(x)) fd + a DE rm 
(Po(a), Po(x)) Jl dz gi ly 2 3 
2? 4+0xr- ixis- a. 
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Assim Po(x), Pi(x:), Po(x:) são dois a dois ortogonais. 

Observe que sempre que desejarmos obter uma sequência de polinômios ortogonais sobre um determi- 
nado intervalo, podemos tomar a sequência 1, x, x?2,... como sendo a sequência original e ortogonalizá-la. 
Exercícios 

1.19 - Usando o processo de Gram-Schmidt e o produto escalar usual do IR?, ortonormalizar a base: 

e = (1, 1, 1)* 62 = (1, =l; 1) e = p=; 0, 1) : 

1.20 - Os vetores {(0, 2, 1, 0)t, (1, —1, 0, 0)*, (1, 2, 0, —1)t, (1, 0, 0, 1) constituem uma base 
não ortonormal do IR$. Construir a partir desses vetores, uma base ortonormal para o IRt, usando o 
processo de Gram-Schmidt. 

1.21 - Ortonormalize a sequência de polinômios obtida no exemplo [1.16 

1.22 - Usando o produto escalar usual em C[1,2] e o processo de Gram-Schmidt construa uma sequência 
de polinômios ortonormais. 

1.4 Projeção Ortogonal 
Veremos aqui a projeção ortogonal de um vetor sobre outro bem como a projeção ortogonal de um 


vetor sobre um sub-espaço. Esse último será utilizado no estudo de aproximações de funções pelo método 
dos mínimos quadrados. 


Projeção Ortogonal de um Vetor sobre Outro 

Sejam x e y vetores não nulos. Escolhemos um número real À tal que À y seja ortogonal a x — À y, 
como sugere a Figura 1.2, no caso em que E = IR2. 
v— Ay 


> » 


Ay y 
Figura 1.2 


De àA y L (x— À y), concluímos que (À y,x — À y) = 0. Portanto, aplicando P}, segue que: 


(x,y) 


Aly, £) — A? (y, y) =05>A= 
(y, y) 


Assim, obtemos a seguinte definição. 


Definição 1.14 - Num espaço euclidiano real, chama-se projeção ortogonal de x sobre y,y * 0,0 
vetor z definido por: 


z = (projeção de x sobre y) = 
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Se || y |= 1, então a projeção de x sobre y é dada por (x,y) y. 

Projeção Ortogonal de um Vetor sobre um Sub-Espaço 
Seja E um espaço euclidiano e seja E”, de dimensão finita n, um sub-espaço de E. 
Seja v um vetor de E não pertencente a E”. 


O problema que desejamos resolver agora é o de obter um vetor vo € E” tal que v — vo seja ortogonal 
a todo vetor de E”. (A Figura 1.3 ilustra o problema, para o caso em que E = IR? e E'=IR?). 
4 


V— Vo 


Figura 1.8 
Seja (e1,e2,...,en) uma base de E”. Como vo € E”, vo pode ser escrito como combinação linear dos 
vetores da base de E”, isto é: 
vo = y1 e1 + Y2 ez +... + Yn En. (1.17) 
O nosso problema consiste em determinar, caso possível, as coordenadas 91,2,- ., Yn de vo. 


Sabemos que se v — vo deve ser ortogonal a todo vetor de E” então é necessário e suficiente que v — vo 
seja ortogonal a todo vetor de uma base de E” (Teorema |1.2). Então, devemos ter: 


(v—vo,e;)) = 0 para j=1,2,...,n ; ouseja: 
(v— (m ei tyz eo +... +)Àh En), €j) = O,j=1,2,...,n. 


A aplicação de P, e P}, fornece: 
yı (er,e;) + Y2 (€2,65) +... + Mlemes) = (ves), j=1,...n. 


Tais equações são conhecidas por equações normais. 
Assim, para obtermos as coordenadas de vo na base (e1,e2,...,en+, devemos resolver o sistema de 
equações lineares: 


ese (e261) e Ma) mn o 
(e1,€2) (e2, e2) rai (en, e2) J2 — É a 5 (1.18) 
(e1,€n) (e2,en) =.. (€n,€n) da CEE 


cuja matriz dos coeficientes é simétrica. 
Mostremos agora que o sistema (1.18) tem uma e uma só solução, isto é, que o problema de deter- 
minação do vetor vo € E”, tal que v — vo seja ortogonal a todo vetor de E”, tem solução única. 
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O vetor vo é denominado projeção ortogonal de v sobre o sub-espaço E”. 
Vamos supor que nossa base de partida fosse uma base {e}, e5, . . . , el, } ortonormal. Esta não seria uma 


hipótese restritiva, uma vez que é sempre possível passar-se de uma dada base para uma base ortonormal, 
(ver processo de Gram-Schmidt). 


Em termos da base ortonormal considerada o vetor vo se exprimiria como: 


t 
nº 


vwo = yea +y eh+... +e 
O sistema linear (1.18) se reduziria a: 


1 O A (v,e1) 
1 wo | (we) 
O 1 Es (v, €n) 
ou simplesmente a: 
y = (me), j = 1,2m, (1.19) 


e portanto os Y; seriam univocamente determinados. 
Sabemos que, conhecidas as coordenandas de um vetor numa base, suas coordenadas em outra qual- 
quer base são também univocamente determinadas. Assim, o sistema (1.18) tem uma única solução 


(V1: V23- --;, Yn)É e a matriz do sistema em apreço é sempre não singular. À projeção ortogonal vo de v 
sobre E” é, portanto, única. 


Exemplo 1.17 - Seja E = C[-1,1], com (f,9) = Ji f(x)g(x)dx. Seja Ko(x) o sub-espaço dos po- 
linômios de grau < 2. O conjunto (Lo(x) = 1, Li(x) = z, La(x) = £?} constitui uma base de Ka(x). 
Determinar a projeção ortogonal de f(x) = zH sobre ka(x). 


Solução: De (1.17) temos: fo = yo Lo(x) + yı Li(x) +92 Lə(x). Assim, devemos determinar yo, V1, Y2- 
Para tanto, montamos o sistema (1.18): 


(Lo, Lo) (Li, Lo) (L2, Lo) Yo (f, Lo) 
(Lo, L1) (Li, La) (L2, Lai) w p= | G) |; 
(Lo, L2) (Li, L2) (L2, Lo) Y2 (f, Lo) 


onde: 


1 
(Lo, Lo) = l dz = 2], = 2, 


1 2 1 
(Lı, Lo) = (Lo, Lı) = [ xz dr = A = 0, 
S 2j 
1 3 1 2 
(Loo) = (Lola) = f a? do = Ea = 
x gla 73 


j 2 
(Lı, La) = Í rdr — 3º 


CAPÍTULO 1. CONCEITOS BÁSICOS 21 


1 a 1 
(L2, Lı) = (L, L2) = s x3 dz = z] = 0, 
—1 


(L2, L2) = 


fi 
(io) = a == (in (2 +4)]4 = 0.51083, 
E 


1 
£ 4 
L dz = 1— d 
EA ie f( a) é 
(z—4 1n (x+ 49)! = —0.04332, 
1 1 16 
L — 4+ — | d 
(F1) fÈ d = | (204451) de 
1 
- (5 -“41+16ln (2+4))] = 0.17328. 
zj 
Assim, obtemos o sistema linear: 
2 0 2/3 “o 0.51083 
0 2/33 0 yı | = | -0.04332 |, 
2/3 0 2/5 y2 0.17328 
cuja solução é: yo = 0.24979 ; yı = — 0.06498 ; y2 = 0.01688. Então, a projeção ortogonal de f(x) = 


zH sobre Kə(x) é 


fo = 0.24979 Lo(x) — 0.06498 Lı(x) + 0.01688 Lo(x) 
0.24979 — 0.06498 x + 0.01688 «2. 


I 


Teorema 1.7 - Teorema da Melhor Aproximação - Seja E’ um sub-espaço de dimensão finita de 
um espaço euclidiano E. Se v for um vetor pertencente a E, então vo, a projeção ortogonal de v sobre 
E", será a melhor aproximação para v no sentido de que 


lv—voll<Iv-gyl, (1.20) 
para qualquer que seja y E€ E”, tal que y £ vo. 


Prova: Devemos mostrar que a menor distância de v ao sub-espaço E” é a distância entre v e o pé da 
perpendicular traçada da extremidade de v sobre E”. (A Figura 1.3 ilustra o problema para o caso em 
que E = R? e F' = R?). 


CAPÍTULO 1. CONCEITOS BÁSICOS 22 


v — Vo 


y Vo 
Vo — y 
Figura 1.4 


Como y, vo E€ E! também vo—y € E" e é portanto ortogonal a v— vp. Assim, obtemos, sucessivamente: 


(v0-mv—-y) = (v-y+vo-— vo, v -— y+ vo- vo) 
= (v-vo,v-v)+2(v—vo,vo—y) + (voy, vo — y). 
Portanto: 
lv- yl? = llv- vl? + ilv- yl? . (1.21) 


Como, por hipótese, y £ vo, concluímos que || vo — y | > 0. Daí, e da igualdade (1.21), obtemos, 
finalmente: 
lv-yl > lv- vl. 
Assim, a desigualdade mostra que a projeção ortogonal vo de v sobre E” é tal que a menor 
distância de v sobre E” é a distância de v a vo. 


Exercícios 


1.23 - Seja x = (1, 7, 10)t um vetor do IR? em relação à base canônica. Considere o sub-espaço P' 
do IR?, gerado pelos vetores fi = (1, 1, 0)/ e fo = (0, 1, 1)*. Determine a projeção ortogonal de x sobre 
Pp". 


1.24 - Seja E = C[0,1], com (f,9) = J f(x)g(x)dx. Seja Kə(x) o sub-espaço dos polinômios de grau 
<2. O conjunto (Qo(x) = 3, Qu(x) =x—3, Qo(x) = x? — x) constitui uma base de Ks(x). Determinar 
a projeção ortogonal de f(x) = 4 sobre ka(a). 


1.5  Auto-Valores e Auto-Vetores 


Nessa seção, investigaremos a teoria de um operador linear T num K-espaço vetorial V de dimensão 
finita. Também associaremos um polinômio ao operador T: seu polinômio característico. Esse polinômio 
e suas raízes desempenham papel proeminente na investigação de T. Apresentaremos também alguns 
conceitos que serão de grande utilidade na obtenção de métodos para determinação numérica de auto- 
valores e auto-vetores de matrizes. 


Definição 1.15 - Uma transformação linear T de um K-espaço vetorial V em um K-espaço vetorial 
U, T :V — U, é uma correspondência que associa a cada vetor x de V um vetor T(x) em U de modo 
que: 


T(ax+ by) = aT(x) +BT(y) vz, veV Va, Be K. 
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Em particular, se U = V, então dizemos que T é um operador linear num K-espaço vetorial V. 
Definição 1.16 - Um escalar À € K é um auto-valor de T se existe um vetor não nulo v E V tal que: 
T(v)=Av. 

Todo vetor v satisfazendo essa relação é um auto-vetor de T correspondente ao auto-valor A. 
Observações: 


1. Se À é um auto-valor de T, então o operador linear pode apenas variar o módulo e o sentido do 
vetor, nunca sua direção. 


2. Os termos valor característico e vetor característico (ou valor próprio e vetor próprio) são frequen- 
temente usados ao invés de auto-valor e auto-vetor. 


Daremos a seguir alguns exemplos. 


Exemplo 1.18 - Seja I : V — V o operador identidade onde V = IR”. Determinar seus auto-valores e 
auto-vetores. 


Solução: Para cada v € V, temos que: 


Portanto, 1 é auto-valor de I e todo vetor não nulo em V é um auto-vetor correspondente ao auto-valor 
1. 


Exemplo 1.19 - Seja D : V — V o operador diferencial onde V é o espaço vetorial das funções dife- 
renciáveis. Determinar um auto-valor de D e seu correspondente auto-vetor. 


Solução: Temos que e*t € V, e, sabemos que: 
D (e!) =ke., 
Logo, k é um auto-valor de D e e”! é auto-vetor de D correspondente ao auto-valor k. 


Exemplo 1.20 - Seja T : IR? — IR? o operador linear que gira cada vetor v € IR? de um ângulo %. 
Determinar os auto-valores e correspondentes auto-vetores nos seguintes casos: 


ab = ma, o = (n+ Dr, dy = =H). 


Solução: Temos que o operador linear que gira cada vetor de um ângulo 1) é dado por uma matriz 
chamada matriz de rotação. No caso em que V = JR? essa matriz é dada por: 


Pal cos Y) a 


—seny cosy 


Seja v € IR?, então v = (v1, v2)*. Podemos considerar nos três casos n = 1, visto que para valores 
maiores de n teremos apenas um número maior de rotações. Assim, para: 


cos 27 sen 2r vi = vi Eno vi 
—sen 27 cos 2r vo E vo = va È 


a) y = 27, temos: 
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b) y = 37, temos: 


cos 37 sen 37 v1 o —u1 -a uv 
—sen 37 cos 37 v2 = —uo = vo ? 

cos Ei sen 3r uv — —Va + X uv 

sen M cos ST v2 v (DD) f 


Logo, os auto-valores de T são: 


c) y = 3% 


Isey = 2nr, —1sey = (2n+1)r, 


e em ambos os casos todo vetor não nulo do IR? é auto-vetor de T. Se y = (2H )r, T não tem 
auto-valores e portanto T não tem auto-vetores. Observe que neste caso o operador linear está variando 
a direção do vetor. 


Se A é uma matriz quadrada n x n sobre K, então um auto-valor de A significa um auto-valor de A 


encarado como operador em K”. Isto é, A € K é um auto-valor de A se, para algum vetor (coluna) não 
nulo v € K”, Av = Av. Nesse caso, v é um auto-vetor de A correspondente a A. 


E 


Determinar os auto-valores e auto-vetores de A. 


Exemplo 1.21 - Seja: 


~ ~ t . . 
Solução: Procuramos um escalar À e um vetor não nulo v = (v1, v2) tais que Av = Av. Assim: 


ie). 


A equação matricial acima é equivalente ao sistema homogêneo: 


(1.22) 


301 + 40, = Av á (3 Avi F 4v = 0 
w1 + v Avo = dm + (1—A)v = 0 


Para que o sistema homogêneo tenha solução não nula, o determinante da matriz dos coeficientes deve 
ser igual a zero. Logo: 


3-A) 4 = o = 
| 9 (1-5) =NM-40A-5=(A-DA+I) = 0. 
Assim, À é um auto-valor de A se e somente se, À = 5 ou À = —1. 
Fazendo À = 5 em (1.22), obtemos: 


—2uv1 + 4va 0 
2v1 = 4v = 0 


ou simplesmente, v1 — 2v2 = 0 > vı = 2v2. Assim v = (v1, v2)* = (2, 1)* é um auto-vetor correspondente 
ao auto-valor À = 5. Qualquer outro auto-vetor correspondente a A = 5 é um múltiplo de v. 
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Fazendo À = —1 em (1.22), obtemos: 


4v1 e 4v2 = 0 

2v1 S 2v2 = 0 
ou simplesmente, vı + v2 = 0 > vı = —v2. Assim v = (vı, vo)! = (1, —1)* é um auto-vetor correspon- 
dente ao auto-valor À = —1 e novamente, qualquer outro auto-vetor correspondente a À— 1 é um múltiplo 


de v. 


Definição 1.17 - Dada uma matriz quadrada A,n x n, a matriz: 


11 — A a12 Gn 
a21 4992 — A ees as 

AA = ý 
an1 An? cas Qan =À 


onde I é a matriz identidade de ordem n e À é um parâmetro, é chamada matriz característica de A. 
Seu determinante , |A— AT], é um polinômio de grau n em À chamado polinômio característico de A. 


1 2 


Exemplo 1.22 - Seja A = ( 3 4 


E Determinar seu polinômio característico. 


Solução: Para calcular o polinômio característico de A, basta calcular o determinante de A— AT. Assim: 


i=zà 2 
AA = | 3 sa 


= AL 5—2. 
— [cem 


polinômio característico. 


Exercícios 
1.25 - Prove que os auto-valores de A são os zeros do polinômio característico. 


1.26 - Prove que: se A, Ao, ..., An são auto-valores de A então AR, AS, ..., AE são auto-valores de 
AF. 


Como já dissemos anteriomente estudaremos, (no Capítulo 7), métodos numéricos para determinação 
de auto-valores e auto-vetores de matrizes. Tais métodos para serem obtidos dependem de alguns con- 
ceitos os quais passamos a discutir agora. 


Polinômio de Matrizes 


Definição 1.18 Seja: 
P(t) = ao t” +a 1+... tanai ttan, 
um polinômio de grau n onde os a;, i = 1,2,...,n são reais. 
Se A é uma matriz quadrada real, então definimos: 


P(A) = a AÀ” +a A +... +an1 Arad, 


como sendo o polinômio da matriz A. Na expressão acima I é a matriz identidade. 
Em particular, se P(A) = 0, (matriz nula), dizemos que A é um zero de P(t). 
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Exemplo 1.23 - Seja A = ( 3 4 


Q)=t-—-5t—2. 


). Calcular P(A) e Q(A), sabendo que: P(t) = 2 — 3t+7 e 


Solução: Temos que: 


Assim, A é um zero de Q(t). Note que Q(t) é o polinômio característico de A. 


Teorema 1.8 - (Teorema de Cayley-Hamilton) - Toda matriz é um zero do seu polinômio característico. 


Prova: A prova desse teorema pode ser encontrada em [Barnett, 1990 ]. 
Transformações de Similaridades (ou Semelhança) 

Existem métodos numéricos que determinam todos os auto-valores de uma matriz sem determinar a 
expressão do polinômio característico. Tais métodos são obtidos usando-se transformações de similari- 
dade. 


Definição 1.19 - Uma matriz B é similar (ou semelhante) a uma matriz A se 3 uma matriz C não 


singular tal que: 
B=C-AC, 


e dizemos que B foi obtida de A por transformação de semelhança. 

Teorema 1.9 - Sejam A e B matrizes similares. Então: 

i) A e B possuem os mesmos auto-valores. 

ii) Se v é auto-vetor de A associado a À, então Ctv é auto-vetor de B = CTIAC associado a À. 


Prova: Seja B = C-1 AC, e suponha que À é auto-valor de A e v seu correspondente auto-vetor. Temos 
então, que det(A — AT) é o polinômio característico de A. 


i) Temos : 
de(B-AI) = det(CT!AC— AI) 
= det(CHA-ANDC) 
= detC”!det(A — AN) detC 
= det(A — ADdet(C/C) = det(A — AJ). 
=I 


Portanto A e B possuem o mesmo polinômio característico. Logo À é auto-valor de B. 
ii) Agora Av = Av e desde que B = CTAC = A=CBC”. Portanto CBCtv = Av. Assim: 
BC tw = Ctv = AC w . 


Portanto B(C7tw) = MC" tv). Logo C7 ly é auto-vetor de B associado ao auto-valor À. 
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Lema 1.1 - Seja A uma matriz de ordem n com auto-valores A; e correspondentes auto-vetores vi, os 
quais vamos supor sejam linearmente independentes, e seja 


Ma O 
A2 


D = Ag 
© An 
Então D=V-!AV se e somente a i-ésima coluna de V é vi. 


Prova: Se a i-ésima coluna de V é denotada por v; então a i-ésima coluna de AV e VD são, Av; e 
A;v;, respectivamente. Portanto os vetores v; são os auto-vetores de A se e somente se AV = VD. Esta 
equação pode ser rearranjada como: V-1! AV desde que V seja inversível, e este é o caso pois as colunas 
de V são linearmente independentes. 


Matriz de Rotação e Matriz Ortogonal 


Alguns métodos numéricos são obtidos usando-se matrizes que possuem características especiais. As- 
sim, passamos a descrever tais matrizes. 


COS Y Sen p cosyp —sen q 
—senp cos Y s sen p cos p 
rotacionam cada vetor do IR?, no sentido horário e anti-horário, respectivamente, de um ângulo y, e 


porisso são chamadas de Matrizes de Rotação. 
No IR? a matriz: 


No IR? as matrizes: 


cosy 0 seng 
0 1 0 ; 
—sen p 0 cosy 


é uma matriz de rotação, no sentido horário, de um ângulo y no plano x, z. 
No IR” a matriz: 


1 
1 
cosy 0 ... O seng 
1 
U = o (1.23) 
1 
—sen p 0 ... O cosy 


onde: 
Upp = Ugg = COSY 
Upg = —Ugp = Seny 
uij = 0, no resto 


CAPÍTULO 1. CONCEITOS BÁSICOS 28 


é uma matriz de rotação de um ângulo y no plano dos eixos p e q. 


Uma Matriz Ortogonal U é caracterizada por: 
U*tU = UU* =1 , 
onde I: matriz identidade. Portanto U' = U-1. 


Observe que matrizes de rotação são matrizes ortogonais. 


Propriedades de Matrizes Ortogonais 


1) As linhas de U satisfazem: 


X (u)? = 1 (produto de uma linha por ela mesma) , 
j=1 
5 Uij Ukj = O (produto de duas linhas distintas) . 
j=1 
itk 

2) [Ux = Ilell, Vz e R”. 


3) A transformação ortogonal não muda os ângulos entre dois vetores. Portanto uma transformação 
ortogonal ou é uma rotação ou é uma reflexão. 


4) Os auto-valores são: 1 ou -1. 
5) O determinante é 1 ou -1. 


Para finalizar essa seção daremos um teorema que nos permite ter uma idéia da localização dos auto- 
valores de uma matriz, seja ela simétrica ou não. Os auto-valores de matrizes não simétricas podem, é 
lógico, serem complexos, e nestes casos o teorema fornece a localização destes números no plano complexo. 
Existem situações onde não é necessário obter os auto-valores com muita precisão, isto é, existem ocasiões 
onde o que desejamos é saber se os auto-valores são positivos ou então se estão contidos no círculo 
unitário. O Teorema a seguir pode ser usado para responder a estas perguntas sem a necessidade de 
cálculos detalhados. 


Teorema 1.10 - Teoremas de Gerschgorin 


a) Primeiro Teorema de Gerschgorin - Os auto-valores de uma matriz A = (aij) estão na reunião dos 


círculos de centro a;; e raio 
n 
P= J laale DEl ssn 
=F 


j=1 
ii 
no plano complexo. 
b) Segundo Teorema de Gerschgorin - Se a união de q desses círculos formam uma região conectada, 


isolada dos círculos restantes, então existe q auto-valores nessa região. 


Prova: A prova deste teorema pode ser encontrada em [Wilkison, 1965]. 
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Exemplo 1.24 - Localizar, usando o teorema de Gerschgorin, os auto-valores de: 


4 —1 1 3 1 0 
A = 1 1 1 RR 1 2 —1 
—2 0 —6 0 — 0 
Solução: Os círculos de Gerschgorin associados com a matriz A são dados por: 
Círculo Centro Raio 
Ci a = 4 ri = |-1|+|i| = 2 
C2 a2 = 1 ro = d+] = 2 
C3 ass = —6 r3 = |-2]+]0] = 2 
Assim para a matriz A, obtemos os círculos ilustrados na Figura 1.5: 
emo . 4 
ımagınaro 
IT C3 Cs Andre PRERE 1 
O M 
( Il A eix 
rea, 
Figura 1.5 
O primeiro teorema de Gerschgorin indica que os auto-valores de A estão inseridos nas regiões ha- 


churadas da Figura 1.5. Além disso, desde que Cj [J Cs não intercepta C3, pelo segundo teorema de 
Gerschgorin, dois desses auto-valores estão em Ci [J C2 e os restantes dos auto-valores em C3. 
Para a matriz B, temos que os círculos de Gerschgorin associados com essa matriz, são dados por: 


Círculo Centro Raio 
Cı bi = 3 rı = |i|+ļ0| = 1 
C2 boo = 2 ra = M+|-1| = 2 
C3 b33 = 0 r3 =[|0/+|-1)=1 


os quais estão ilustrados na Figura 1.6. 


Figura 1.6 


Podemos afirmar neste caso, usando os teoremas de Gerschgorin, que os auto-valores da matriz B 
estão no intervalo [—1,4], pois a matriz é real e simétrica. 
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Exercícios 


1.27 - Dada as seguintes matrizes: 


1 Ba 
do jade -1 0 1l, 
2 1 -1 


calcule o polinômio característico, seus auto-valores e auto-vetores. 


1.28 - Seja A = ( ; ; | Calcule os auto-valores de A, A2, AÌ. 
1.29 - Seja A = ( a | Calcular P(A) e Q(A), sabendo que: P(t) = 2? —3t+7 e 
QH =t- 5. 


1.6 Exercícios Complementares 
1.30 - Se x= (1, 2, 3, 4} e y = (0, 3, —2, 1)*, calcule: 
a) (x,y) (usando definição usual de produto escalar), 
b) Ixl e lly], 
1.31 - Mostre que num espaço euclidiano vale o Teorema de Pitágoras, isto é: 
zily =| z+yl? =el? + yl. 
1.32 - Mostre que num espaço euclidiano, vale: 
llel- lyi] <silez-yl 
1.33 - Sejam x = (x1, x2)* e y = (y1, y2)* vetores do IR2. 


a) Prove que: 
(£z,y) = tı Yy — 2 T1 y2 — 2 z2 yı + 52292, 


define um produto escalar no IR?. . 
b) Determine a norma de x = (1, 2)t € IR?, em relação ao produto escalar do item a). 


1.34 - Os vetores {(1, 1, 0)t, (0, 1, 1), (1, 0, 1)') constituem uma base não ortonormal do IR. 
Construir a partir desses vetores, uma base ortonormal para o IR?, usando o processo de Gram-Schmidt. 


1.35 - Obter, no intervalo [0,1], uma sequência ortonormal de polinômios, relativamente ao produto 


escalar.: 


1 
(o) = | Fe) a) de. 
0 
1.36 - Considere o espaço dos polinômios de grau < 2 com o produto escalar: 
1 
(PaP) = f PO PIO de 
0 


Dada nesse espaço a base (3, t— 3, t? — t}, obtenha a partir dela uma base ortogonal, usando o 


processo de Gram-Schmidt. 
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1.37 - Sejam e1, e2, e3 a base canônica do IRÊ, e seja v = (1, 1, 2)*. Determinar a projeção ortogonal 
de v sobre o plano (ei, e2}. 


1.38 - Seja E = C[1,2], com (f,9) = J f(x)g(x)dx. Seja Kı(x) o sub-espaço dos polinômios de grau 
< 1. O conjunto (1, x} constitui uma base de Ki(x). Determinar a projeção ortogonal de f(x) = e” 


sobre k(x). 


1.39 - Resolva o exercício |1.24) usando para o sub-espaço a base ortogonal obtida no exercício [1.36 
Compare os resultados. 


1.40 - Para cada uma das matrizes: 


14 3 
a-( 3 a ia die 03 71), 
0 2 -1 
encontre um polinômio que tenha a matriz como raiz. 
1.41 - Seja A uma matriz quadrada de ordem n e sejam A1, Ao,--- , An seus auto-valores. Quais são 


os auto-valores de A — qI onde q é uma constante e I é a matriz identidade? 


1.42 - Mostre que se v é auto-vetor de A e de B então v é auto-vetor de aA + BB, onde a,B são 
escalares quaisquer. 


1.43 - Mostre que uma matriz A e sua transposta At possuem o mesmo polinômio característico. 


1.44 - Usando o Teorema localizar os auto-valores das seguintes matrizes: 


2 —1 0 4 0 1 
A = — 2 —1 >, B= -2 1 0 
0 —1 1 —2 0 1 


Capítulo 2 


Análise de Arredondamento em 
Ponto Flutuante 


2.1 Introdução 


Neste capítulo, chamamos atenção para o fato de que o conjunto dos números representáveis em 
qualquer máquina é finito, e portanto discreto, ou seja não é possível representar em uma máquina todos 
os números de um dado intervalo [a,b]. A implicação imediata desse fato é que o resultado de uma 
simples operação aritmética ou o cálculo de uma função, realizadas com esses números, podem conter 
erros. A menos que medidas apropriadas sejam tomadas, essas imprecisões causadas, por exemplo, por 
simplificação no modelo matemático (algumas vezes necessárias para se obter um modelo matemático 
solúvel); erro de truncamento (troca de uma série infinita por uma finita); erro de arredondamento 
(devido a própria estrutura da máquina); erro nos dados (dados imprecisos obtidos de experimentos, 
ou arredondados na entrada); etc, podem diminuir e algumas vezes destruir, a precisão dos resultados, 
mesmo em precisão dupla. 

Assim, nosso objetivo aqui será o de alertar o leitor para os problemas que possam surgir durante a 
resolução de um problema, bem como dar subsídios para evitá-los e para uma melhor interpretação dos 
resultados obtidos. 


2.2 Sistema de Números Discreto no Computador 


Inicialmente, descreveremos como os números são representados num computador. 


Representação de um Número Inteiro 


Em princípio, a representação de um número inteiro no computador não apresenta qualquer difi- 
culdade. Qualquer computador trabalha internamente com uma base fixa 5, onde 8 é um inteiro > 2: e 
é escolhido como uma potência de 2. 

Assim dado um número inteiro n Æ 0, ele possui uma única representação, 


n = =nanaa nano) = (no? +n-18! +...n- 485), 


onde os n;, i = 0,—1,...,—k são inteiros satisfazendo 0 < n; < 8 e n £0. 


32 


CAPÍTULO 2. ANÁLISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 33 


Por exemplo, na base 5 = 10, o número 1997 é representado por: 
1997 = 7x10º+9x10!+9x 1024+1x 10°, 


e é armazenado como n.3n-9n-1No. 


Representação de um número real 
A representação de um número real no computador pode ser feita de duas maneiras: 
a) Representação em ponto fixo 
Este foi o sistema usado, no passado, por muitos computadores. Assim, dado um número real, 


x + 0, ele será representado em ponto fixo por: 


n 


p = Es 2; 0, 


i=k 


onde k e n são inteiros satisfazendo k < n e usualmente k <0en>0eos x; são inteiros satisfazendo 
Por exemplo, na base 5 = 10, o número 1997.16 é representado por: 


2 


1997.16 = 53 up” 


1=—3 
= 1x10?+9x10?+9x 10! +7x10°?+1 x107! +6 x 107? 
1 x 1000 +9 x100+9x10+7x1+1x0.1+6x 0.01, 


e é armazenado como LT. 3% 9% 14LXpo.Xj Lo. 
b) Representação em Ponto Flutuante 


Esta representação, que é mais flexível que a representação em ponto fixo, é universalmente utilizada 
nos dias atuais. Dado um número real, x 0, este será representado em ponto flutuante por: 


t = +dx p, 


onde 8 é a base do sistema de numeração, d é a mantissa e e é o expoente. A mantissa é um número em 
ponto fixo, isto é: 
n 
5 —i 
d = di B , 
i=k 


onde, frequentemente, nos grandes computadores, k = 1, tal que se x Æ 0, então dı £0; 0 < d; < b, i= 
1,2,...t, com t a quantidade de dígitos significativos ou precisão do sistema , 8371 < d< 1e-m<e< M. 


Observações: 
a) dı #0 caracteriza o sistema de números em ponto flutuante normalizado. 


b) o número zero pertence a qualquer sistema e é representado com mantissa igual a zeroe e = —m. 
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Exemplo 2.1 - Escrever os números: 
zı = 0.35; 42 = —5.172; x3 = 0.0123; x4 = 5391.3 e zs = 0.0003 , 
onde todos estão na base B = 10, em ponto flutuante na forma normalizada. 


Solução: Temos então: 


0.35 = (3x107! +5 x 107?) x 10° = 0.35 x 10° , 
—5.172 = -—(5 x 1071 +1 x107? +7 x 107+ 2 x 1074) x 10! 
= —0.5712 x 10! , 
0.0123 = (1x107t+2 x107? +3 x 1078) x 1071 = 0.123 x 107! , 
5391.3 = (5x10143x10-24+9x103+1x10-44+3 x 1075) x 104 
= 0.53913 x 104, 
0.0003 = (3x10-!)x 1073 = 0.3 x 1073. 


Agora, para representarmos um sistema de números em ponto flutuante normalizado, na base 5, com 
t dígitos significativos e com limites do expoente m e M , usaremos a notação: F(8,t, m, M). 


Assim um número em F(B,t,m,M) será representado por: 


+ O.dido ...de x B°, 


ondedi£0e-m<e<mM. 


Exemplo 2.2 - Considere o sistema F(10,3,2,2). Represente nesse sistema os números do exemplo 
anterior. 


Solução: Temos então que nesse sistema um número será representado por + O.didod3 x 10º, onde 
—2 < e < 2. Assim: 


0.35 = 0.350 x 10º, 
—5.172 = —0.517 x 10! , 
0.0123 = 0.123 x 107! , 


Observe que os números 5391.3 e 0.0003 não podem ser representados no sistema. De fato, o 
número 5391.3 = 0.539 x 104 e portanto o expoente é maior que 2, causando overflow, por outro lado 
0.0003 = 0.300 x 107% e assim o expoente é menor que -2 causando underflow. 


Podemos então definir formalmente dígitos significativos de um número. 


Definição 2.1 - Seja a base do sistema de números em ponto flutuante. Dígitos significativos de um 
número x, são todos os algarismos de 0 a 8 — 1, desde que x esteja representado na forma normalizada. 


Para exemplificar as limitações da máquina, consideremos agora o seguinte exemplo. 


Exemplo 2.3 - Seja f(x) uma função contínua real definida no intervalo [a,b], 
a<besejamf(a)<0ef(b)>0. Então de acordo com o teorema do valor intermediário, existe x, 
a<x<btalque f(x) =0. Seja f(x) = zx? — 3. Determinar x tal que f(x) = 0. 


Solução: Para a função dada , consideremos t = 10 e 8 = 10. Obtemos então: 


f(0.1442249570 x 101) = —0.2 x 1078 ; 
f(0.1442249571 x 10!) = 0.4 x 1078 . 


Observe que entre (0.1442249570 x 10! e 0.1442249571 x 10! não existe nenhum número que possa 
ser representado no sistema dado e que a função f muda de sinal nos extremos desse intervalo. Assim, 
esta máquina não contém o número «x tal que f(x) = 0 e portanto a equação dada não possui solução. 
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Exercícios 


2.1 - Considere o sistema F(10,4,4,4). Represente neste sistema os números: xı = 4321.24, £2 = 
—0.0013523, x3 = 125.64, x4 = 57481.23 e x5 = 0.00034. 


2.2 - Represente no sistema F(10,3,1,3) os números do exercício[2.1) 


Mudança de Base 


Como já dissemos anteriormente a maioria dos computadores trabalham na base 8 onde 5 é um 
inteiro > 2; e é normalmente escolhido como uma potência de 2. Assim um mesmo número pode ser 
representado em mais do que uma base. Além disso sabemos que, através de uma mudança de base, 
é sempre possível determinar a representação em uma nova base. Veremos então, através de exemplos, 
como se faz mudança de base. 


Exemplo 2.4 - Mudar a representação dos números: 
i) 1101 da base 2, para a base 10, 

ii) 0.110 da base 2, para a base 10, 

iii) 13 da base 10, para a base 2, 

iv) 0.75 da base 10, para a base 2, 


v) 3.8 da base 10, para a base 2. 


Solução: Para cada número daremos qual o procedimento a ser seguido. Assim: 
i) 1101 que está na base 2, para a base 10. 


Neste caso o procedimento é multiplicar cada algarismo do número na base 2 por potências crescente 
de 2, da direita para a esquerda e somar todas as parcelas. Assim: 


101 = 1x24+0x24+1x2+1x2=14+04+44+8=13. 


Logo, (1101) = (13)io. 
ii) 0.110 que está na base 2, para a base 10. 


Neste caso o procedimento é multiplicar cada algarismo do número na base 2, após o ponto, por 
potências decrescente de 2, da esquerda para a direita e somar todas as parcelas. Assim: 


1 1 
0.110 = Teee e e a +75 +0=0.75. 


Logo, (0.110), = (0.75)io. 


iii) 13 que está na base 10, para a base 2. 


CAPÍTULO 2. ANÁLISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 36 


Neste caso o procedimento é dividir o número por 2. A seguir continuar dividindo o quociente por 2 
até que o último quociente seja igual a 1. O número na base 2 será então obtido tomando-se o último 
quociente e todos os restos das divisões anteriores. Assim: 


13 | 2 
1 6 | 2 
0 3 | 2 


Logo, (13)10 = (1101)2. 
iv) 0.75 que está na base 10, para a base 2. 


Neste caso o procedimento é multiplicar a parte decimal por 2. A seguir continuar multiplicando a 
parte decimal do resultado obtido, por 2. O número na base 2 será então obtido tomando-se a parte 
inteira do resultado de cada multiplicação. Assim: 


0.75x2 = 1.50 
0.50x2 = 1.00 
0.00x2 = 0.00 


Logo, (0.75)10 = (0.110)2. 
v) 3.8 que está na base 10, para a base 2. 


O procedimento neste caso é transformar a parte inteira seguindo o item iii) o que nos fornece 
(3)10 = (11), e a parte decimal seguindo o item iv). Assim, obtemos: 


0.8x2 = 1.6 
0.6x2 = 1.2 
0.2x2 = 04 
04x2 = 0.8 
0.8 x 2 


Logo, (3.8)1o = (11.11001100...)2. Portanto o número (3.8)19 não tem representação exata na base 
2. Esse exemplo ilustra também o caso de erro de arredondamento nos dados. 


No exemplo mudamos a representação de números na base 10 para a base 2 e vice-versa. O 
mesmo procedimento pode ser utilizado para mudar da base 10 para uma outra base qualquer e vice- 
versa. A pergunta que surge naturalmente é: qual o procedimento para representar um número que está 
numa dada base 5, em uma outra base 35, onde 81 Æ B2 # 10? Nesse caso devemos seguir o seguinte 
procedimento: inicialmente representamos o número que está na base 5, na base 10 e a seguir o número 
obtido na base 10, na base 55. 


Exemplo 2.5 - Dado o número 12.20 que está na base 4, representá-lo na base 3. 
Solução: Assim, usando os procedimentos dados no exemplo [2.4] obtemos: 

12 = 2x4 +1x4 =6. 

0.20 = 2x4" +0x4? = Z 05. 
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Portanto: (12.20), = (6.5)10. Agora: 


6 | 

0 2 
0.5x3 = 15 
0.5x3 = 15 


Portanto: (6.5)10 = (20.11...)3. Logo (12.20)4 = (20.111 ...)3. Observe que o número dado na base 
4, tem representação exata na base 10, mas não na base 3. 


Exercícios 


2.3 - Considere os seguintes números: xı = 34, xo = 0.125 e x3 = 33.023 que estão na base 10. 
Escreva-os na base 2. 


2.4 - Considere os seguintes números: xı = 110111, zə = 0.01011 e z3 = 11.0101 que estão na base 
2. Escreva-os na base 10. 


2.5 - Considere os seguintes números: xı = 33, z2 = 0.132 e z3 = 32.013 que estão na base 4. 
Escreva-os na base 5. 


2.3 Representação de Números no Sistema F(6,t, m, M) 


Sabemos que os números reais podem ser representados por uma reta contínua. Entretanto, em ponto 
flutuante podemos representar apenas pontos discretos na reta real. Para ilustrar este fato consideremos 
o seguinte exemplo. 


Exemplo 2.6 - Quantos e quais números podem ser representados no sistema F(2,3,1,2)? 


Solução: Temos que 8 = 2 então os dígitos podem ser 0 ou 1; m = 1 e M = 2 então -1 <e <2 e 
t= 3. Assim, os números são da forma : 


E 0.dıd2d3 x Be . 


Logo temos: duas possiblidades para o sinal, uma possiblidade para dı, duas para ds , duas para d3 
e quatro para as formas de 5º. Fazendo o produto 2 x 1 x 2x 2x 4 obtemos 32. Assim neste sistema 
podemos representar 33 números visto que o zero faz parte de qualquer sistema. 

Para responder quais são os números, notemos que as formas da mantissa são : 0.100, 0.101, 0.110 
e 0.111 e as formas de 8º são: 271, 20, 21, 92, Assim, obtemos os seguintes números: 


g= Z (0.25)10 

20 = (0.5)o 

0.100 x 2 = (1.00 

2? = (2.0)o, 

desde que (0.100)2 = (0.5)10; 

27t = (0.3125)10 

2º = (0.625) 

0.101 x De Ads 

2? = (25)ho, 
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desde que (0.101), = (0.625)10; 


9-1 = (0.375) 10 
20 = (0.75 
ooxy à 2 As 
2? = (3.0) 10 , 
desde que (0.110), = (0.75)10; 
9-1 = (0.4375)10 
20 = (0.875) 
oniwa à Do Ar 
2? = (36d 
desde que (0.111), = (0.875)10 . 


Exemplo 2.7 - Considerando o mesmo sistema do exemplo [2.6] represente os números: xı = 0.38, 
z2 = 5.3 e 73 = 0.15 dados na base 10. 


Solução: Fazendo os cálculos obtemos que: (0.38)19 = 0.110 x 27t, (5.3) = 0.101 x 2º e (0.15) = 
0.100 x 2-2. Assim apenas o primeiro número pode ser representado no sistema, pois para o segundo 
teremos overflow e para o terceiro underflow. Observe que o número (0.38)19 tem no sistema dado, a 
mesma representação que o número (0.375)10 - 


Exercícios 


2.6 - Considere o sistema F(3,3,2,1). 

a) Quantos e quais números podemos representar neste sistema? 
b) Represente no sistema os números: xı = (0.40)10, £2 = (2.8)10. 
2.7 - Considere o sistema F(2,5,3,1). 

a) Quantos números podemos representar neste sistema? 


b) Qual o maior número na base 10 que podemos representar neste sistema (sem fazer arredonda- 


mento)? 


Todas as operações num computador são arredondadas. Para ilustrar este fato, consideremos o seguinte 
exemplo. 


Exemplo 2.8 - Calcular o quociente entre 15 e 7. 


Solução: Temos três representações alternativas: 

15 1 

— = 2- = 2.142857. 
7 , T2 7 T3 


Note que zı e £2 são representações exatas e xz é uma aproximação do quociente. 


lj = 


Suponha agora que só dispomos de 4 dígitos para representar o quociente t5. Daí, 45 = 2.142. 


Mas não seria melhor aproximarmos 15 por 2.143? A resposta é sim e isso significa que o número foi 
arredondado. Mas o que significa arredondar um número? 
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Arredondamento em Ponto Flutuante 


Definição 2.2 - Arredondar um número x, por outro com um número menor de dígitos significativos, 
consiste em encontrar um número X, pertecente ao sistema de numeração, tal que |T — x| seja o menor 
possível. 


Assim para o exemplo dado |2.142 — x3| = 0.000857 e |2.143 — z3| = 0.000143. Logo 2.143 representa 
a melhor aproximação para 5, usando 4 dígitos significativos. 


Daremos a seguir a regra de como arredondar um número. 


Dado z, seja z sua representação em F(8,t,m, M) adotando arredondamento. Se x = 0 então 7 = 0. 
Se x Æ 0, então escolhemos s e e tais que: 


|z| = sx 8° onde B!(1- 58) <s<1l- GB, (2.1) 


Se e está fora do intervalo [-m, M] não temos condições de representar o número no sistema. Se 
e € [-m, M] então calculamos: 


1 
s+ 58" = O.di do .. «dedo E 
e truncamos em t dígitos. Assim o número arredondado será: 
z = (sinalr)(0.dıdə ... d4) x 8°. 


Exemplo 2.9 - Considere o sistema F(10,3,5,5). Represente neste sistema os números: xı = 1234.56, £2 = 
—0.00054962, x3 = 0.9995, x4 = 123456.7 e xs = —0.0000001 . 


Solução: Primeiramente, analisemos quais os valores permitidos para s. Desde que 85 = 10 e t = 3, 


usando (2.1), segue que: 


1 1 
—l 24073 a nf —3 
10-1(1- 510) < s <1- 5108, 


e fazendo os cálculos obtemos que: 
0.09995 < s < 0.9995 . 


Podemos agora tentar representar os números no sistema dado. Assim: 
i) Para xı = 1234.56, obtemos: 


|zı| = 0.123456 x 104, 


s + 1053 = 0.123456 + 0.0005 = 0.123956, 


Z = 0.123 x 104; 


ii) para £2 = —0.00054962, obtemos: 


xo] = 0.54962 x 1078, 
s+ 41078 = 0.54962 + 0.0005 = 0.55012, 


Ēə = —0.550 x 1073; 
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iii) para x3 = 0.9995, observe que não podemos considerar |x3| = 0.9995 x 10º, pois neste caso s não 
pertence ao seu intervalo, e o número arredondado não estaria escrito na forma dos elementos do 
sistema. Assim neste caso consideramos: 


xs] = 0.09995 x 101, 
s+ 41073 = 0.09995 + 0.0005 = 0.10045, 
Z3 = 0.100 x 10! ; 


iv) para z4 = 123456.7, obtemos: 
|z4| = 0.1234567 x 10°, 


v) para x5 = —0.0000001, obtemos: 
lxs| = 0.1 x 1072. 


Observe que tanto em iv) como em v) não podemos representar o número no sistema dado pois em 
iv) teremos overflow e em v) underflow. 


Assim, em linhas gerais, para arredondar um número, na base 10, devemos apenas observar o primeiro 
dígito a ser descartado. Se este dígito é menor que 5 deixamos os dígitos inalterados e se é maior ou igual 
a 5 devemos somar 1 ao último dígito remanescente. 


Exercício 
2.8 - Considere o sistema F(10,4,4,4). 
a) Qual o intervalo para s neste caso? 


b) Represente os números do exemplo [2.9) nesse sistema. 


2.4 Operações Aritméticas em Ponto Flutuante 


Considere uma máquina qualquer e uma série de operações aritméticas. Pelo fato do arredondamento 
ser feito após cada operação temos, ao contrário do que é válido para números reais, que as operações 
aritméticas (adição, subtração, divisão e multiplicação) não são nem associativas e nem distributivas. 
Ilustraremos esse fato através de exemplos. 


Nos exemplos desta seção considere o sistema com base 8 = 10, e 3 dígitos significativos. 


Exemplo 2.10 - Efetue as operações indicadas: 


i) (114+43.18) +5.05 e 114+ (3.18 + 5.05) , 
ü) BIA e (348) x114, 


iii) 3.18 x (5.05 + 11.4) e 3.18 x 5.05 + 3.18 x 11.4. 
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Solução: Para cada item, fazendo o arredondamento após cada uma das operações efetuada, segue que: 


i) (114+3.18)+5.05 = 146+5.05 = 19.7, 


enquanto 


114+(3.18+5.05) = 114+8.23 = 196. 
W Cas — “="05050 Aa 


enquanto 
(238) x 114 = 0.630 x 11.4 = 7.18. 
ii) 3.18 x (5.05 +11.4) = 3.18 x 165 = 52.3, 


enquanto 


3.18 x 5.05 + 3.18 x 11.4 = 16.1 +36.3 = 52.4. 


Exemplo 2.11 - Somar l dez vezes consecutivas usando arredondamento. 


Solução: Temos então: 
0.333 + 0.333 + . .. + 0.333 = 3.31. 
Á———— amaa 


10 vezes 
Entretanto podemos obter um resultado melhor se multiplicarmos 0.333 por 10, obtendo assim 3.33. 


Exemplo 2.12 - Avaliar o polinômio 
P(x) = £? — 67º + 47 - 01, 
no ponto 5.24 e comparar com o resultado exato. 


Solução: Para calcular o valor exato consideremos todos os dígitos de uma máquina, sem usar arredon- 
damento a cada operação. Assim: 


P(5.24) = 143.8777824 — 164.7456 + 20.96 — 0.1 = —0.00776 ( valor exato). 
Agora, usando arredondamento a cada operação efetuada, obtemos: 


P(5.24) = 5.24 x 27.5 — 6x27.5 + 4x5.24 — 01 
= 144. — 165. + 21.0 — 01 
= —0.10 (somando da esquerda para a direita) 
= 0.00 (somando da direita para a esquerda). 


Entretanto, observe que P(x) pode ser escrito como: 
P(x) = x (x (x — 6) + 4) — 01. 
Assim: 
P(5.24) = 5.24 (5.24 (5.24 — 6) + 4) — 0.1 
5.24 (—3.98 + 4) — 0.1 
= 5.24 (0.02) — 0.1 


0.105 — 0.1 
= 0.005 (sinal errado). 


I 
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Observando os três últimos exemplos, vemos que erros consideráveis podem ocorrer durante e execução 
de um algoritmo. Isso se deve ao fato de que existem limitações da máquina e também que os erros de 
arredondamento são introduzidos a cada operação efetuada. Em consequência, podemos obter resultados 
diferentes mesmo utilizando métodos numéricos matematicamente equivalentes. 

Assim, devemos ser capazes de conseguir desenvolver um algoritmo tal que os efeitos da aritmética 
discreta do computador permaneça inofensivo quando um grande número de operações são executadas. 


Exercícios 
2.9 - Considere o sistema F(10,3,5,5). Efetue as operações indicadas: 
i) (1.386 — 0.987) + 7.6485 e 1.386 — (0.987 — 7.6485) , 


à) Mal e (18%) - (257) 


’ 


2.10 - Seja 
17.678 (9.617)? 
3.471 ` 3.716 x 1.85 


a) Calcule « com todos os algarismos da sua calculadora, sem efetuar arredondamento. 


b) Calcule x considerando o sistema F(10,3,4,3). Faça arredondamento a cada operação efetu- 
ada. 


2.11 - Seja P(x) = 2.3 x? — 0.6 x? + 1.8 x — 2.2 . Deseja-se obter o valor de P(x) para z = 1.61. 
a) Calcule P(1.61) com todos os algarismos da sua calculadora, sem efetuar arredondamento. 


b) Calcule P(1.61) considerando o sistema F(10,3,4,3). Faça arredondamento a cada operação 
efetuada. 
2.12 - Seja: 
” n(n + 1) 
p= Ea o a 
i=l 
Calcule S, considerando n = 1000 e efetuando a soma dos termos em: 


a) ordem crescente, 


b) ordem decrescente. 


2.5 Efeitos Numéricos 


Além dos problemas dos erros causados pelas operações aritméticas, das fontes de erros citadas no 
início deste capítulo, existem certos efeitos numéricos que contribuem para que o resultado obtido não 
tenha crédito. Alguns dos mais frequentes são: 


e Cancelamento 
e Propagação do Erro 
e Instabilidade Numérica 


e Mal Condicionamento 
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2.5.1 Cancelamento 


O cancelamento ocorre na subtração de dois números quase iguais. Vamos supor que estamos 
operando com aritmética de ponto flutuante. Sejam x e y dois números com expoente e. Quando 
formamos a diferença x — y ela também terá o expoente e. Se normalizarmos o número obtido, veremos 
que devemos mover os dígitos para a esquerda de tal forma que o primeiro seja diferente de zero. Assim, 
uma quantidade de dígitos iguais a zero aparecem no final da mantissa do número normalizado. Estes 
zeros não possuem significado algum.Veremos este fato através de exemplos, onde iremos considerar que 
estamos trabalhando com o sistema F(10,10,10,10). 


Exemplo 2.13 - Calcular: 


v 9876 — v 9875. 
Solução: Temos que: 
v9876 = 0.9937806599 x 10? e v9875 = 0.9937303457 x 102. 


Portanto: 
V9876 — 9875 = 0.0000503142 x 102. 


A normalização muda este resultado para: 0.5031420000 x 1074. Assim os quatro zeros no final da 
mantissa não têm significado e assim perdemos 4 casas decimais. A pergunta que surge naturalmente é: 
podemos obter um resultado mais preciso? Neste caso a resposta é sim. Basta consideramos a identidade: 


T—y 
yz- y = JE, 
vY Vz +y 
e assim, no nosso caso, obtemos: 


= 1 
V9876 — 9875 = 


V9876 + 9875 


que é um resultado com todos os dígitos corretos. 


= 0.5031418679 x 1074 . 


Exemplo 2.14 - Resolver a equação: 
r? — 1634 r+2=0. 
Solução: Temos: 


1634 + (1634)? — 4(2) 
2 


817 + v 667487. 


Assim: 


xı = 817+816.9987760 = 0.1633998776 x 10º, 
z2 = 817 -— 816.9987760 = 0.1224000000 x 1072. 


Os seis zeros da mantissa de x2 são resultado do cancelamento e portanto não têm significado algum. 
Uma pergunta que surge naturalmente é: podemos obter um resultado mais preciso? Neste caso a resposta 
é sim. Basta lembrar que o produto das raízes é igual ao termo independente da equação, ou seja: 


£1 X T2 = 254% = —. 
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Logo: x» = 0.1223991125 x 1072, onde agora todos os dígitos estão corretos. 


Nos exemplos dados foi razoavelmente fácil resolver o problema do cancelamento. Entretanto, cabe sa- 
lientar, que nem sempre existe uma maneira trivial de resolver problemas ocasionados pelo cancelamento. 


2.5.2 Propagação do erro 


O cancelamento não ocorre somente quando dois números quase iguais são subtraidos diretamente 
um do outro. Ele também ocorre no cálculo de uma soma quando uma soma parcial é muito grande 
quando comparada com o resultado final. Para exemplificar, consideremos que: 


seja a soma a ser calculada, onde os ay podem ser positivos ou negativos. Vamos supor que o cálculo seja 
feito através de uma sequência de somas parciais da seguinte forma: 


8S1=G, Sk = Sk—-1 tAk, k = 2,3,” n, 


tal que s = sn. 

Se a soma é calculada em aritmética de ponto fixo, então cada ap está afetado de algum erro, os quais 
são limitados por algum e para todo k. Se nenhum overflow ocorre, o erro na soma final s será de no 
máximo ne. Agora devido ao fato de nem todos os a; terem o mesmo sinal então o erro será menor do 
que ne. 

Mas se a soma é calculada em aritmética de ponto flutuante um novo fenômeno pode ocorrer. Vamos 
supor que uma das somas intermediárias sy; é consideravelmente grande em relação à soma final s, no 
sentido que o expoente de sy excede o expoente de s em, digamos, p unidades. É claro que isso só pode 
ocorrer se nem todos os ay possuem o mesmo sinal. Se simularmos tal soma em aritmética de ponto fixo 
(usando para todas as somas parciais o mesmo expoente de s) então devemos trocar os últimos p dígitos 
de sk por zeros. Estes dígitos infuenciam os últimos dígitos de s, e, como em geral, estão errados, não 
podemos falar que o erro final será pequeno. 

A perda de algarismos significativos devido a uma soma intermediária grande é chamada de Pro- 
pagação do Erro. Veremos este fato através de exemplos. 


Exemplo 2.15 - Calcular e755, utilizando 5 dígitos significativos em todas as operações. 


Solução: O seguinte resultado matemático é bem conhecido: para todo número real x, 


— k 

e = a NUE 

Da z 
k=0 

Se e” é calculado usando esta fórmula, a série deve ser truncada. Assim já estaremos introduzindo 

um erro de truncamento. 


Vamos considerar os primeiros 20 termos da série acima para avaliar e7525. Temos então: 


e 25 — (0.10000 — 0.52500)10! + (0.13781 — 0.24117 + 0.31654 — 0.33236 
0.29082 — 0.21811 + 0.14314)102 + (—0.83497 + 0.43836 — 0.20922)10! 
+ (0.91532 — 0.36965 + 0.13862)10º + (—0.48516 + 0.15919)1071! 

+ (—0.49164 + 0.14339)1072 + (—0.39620 + 0.10401)10"? 

+ (—0.26003)1074 + (0.62050 — 0.14163)107 + (0.30982)1078 . 
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Efetuando os cálculos obtemos: e7525 = 0.65974 x 102. Observe que, usando uma calculadora, o 
resultado de e7525 é 0.52475 x 1072. Essa diferença entre os valores obtidos ocorreu porque na expressão 
acima temos parcelas da ordem de 102 que desprezam toda grandeza inferior a 103 (ver Tabela 2.1), 
enquanto que o resultado real de «3:25 é constituido quase que exclusivamente de grandezas dessa ordem. 
A pergunta que surge naturalmente é: podemos obter um resultado mais preciso? A resposta é sim. Basta 


-5.25 — 


lembrar que e e que: 


X qr 
eo 


para todo número real x. Somando todas as parcelas da expressão de e>-25, (desde que a expansão de 


e” ee” diferem apenas em termos de sinal), obtemos: e>:25 = 0.19057 x 103, e assim 3:25 = ER = 
1 = —2 
019057 x 103 ~ 0.52475 x 1074. 
Na Tabela 2.1, apresentamos os cálculos de e7525, e7525 e sis , considerando a expansão até o termo 
de ordem 10% ,k = 1,0, —1,...,—6. 
Tabela 2.1 
10% e7525 e525 1 
e525 
101 0.64130(10º) 0.18907(10º) 0.52890(102) 
10º 0.42990(1071) 0.19049(102) 0.52496(1072) 
1071 0.10393(10-1) 0.19056(10º) 0.52477(1072) 
107? 0.69105(107°?) 0.19056(10º) 0.52477(1072) 
1078 0.66183(107°?) 0.19057 (10°) 0.52475(1072) 
1074 0.65929(107?) 0.19057 (10°) 0.52475(107?) 
1075 0.65971(107°?) 0.19057 (10°) 0.52475(1072) 
1076 0.65974(107°?) 0.19057(10º) 0.52475(1072) 


para um valor fixo dea>>1 e, n=0,1,...,10. 


Solução: Sabemos que os números yn são positivos. Além disso, como para0<r<1,atl<a”,os 
números yn formam uma sequência monotonicamente decrescente, e ainda: 


1 n 1 n 
/ z de <m< f Z de, 
0 l+a 0 a 


e portanto podemos afirmar que: 


< Yn < 


1 
(n+1)(1 +a) (n+1)a ` 
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Assim para a = 10 e n = 10, temos que: 
0.0082645 < y10 < 0.0090909 . (2.2) 


Agora para calcular numericamente o valor da integral dada, podemos primeiramente expressar o 
integrando usando o Teorema binomial, isto é: 


q = |(&+a)-a]” = Sen ( E ) æt aja 


k=0 


Substituindo x” na expressão para yn, obtemos: 


Yn = f 5-1)" ( $ (x + a)? taĂ de 


e assim: 


(2.3) 
l+a 
n i 
a 


| ( a)" 1 


Para a = 10 e n = 10, utilizando (2.3) para calcular yn, obtemos yn = —2.000000, que comparado 
com (2.2), está totalmente errado. A razão para isso é uma extrema propagação de erro. Para n = 10,0 
termo correspondente a k = 5 na soma (2.3) é igual a: 


(apos ( A ) Eata =) = —3.13 x 10". 


Assim para uma calculadora com 10 dígitos na mantissa, no mínimo dois dígitos antes do ponto 
decimal do resultado são não confiáveis, bem como os dígitos depois do ponto decimal. 


2.5.3 Instabilidade Numérica 


Se um resultado intermediário de um cálculo é contaminado por um erro de arredondamento, este 
erro pode influenciar todos os resultados subsequentes que dependem desse resultado intermediário. Os 
erros de arredondamento podem propagar-se mesmo que todos os cálculos subsequentes sejam feitos com 
precisão dupla. Na realidade, cada novo resultado intermediário introduz um novo erro de arredonda- 
mento. É de se esperar portanto, que todos esses erros influenciem o resultado final. Numa situação 
simples como o caso de uma soma, o erro final pode ser igual a soma de todos os erros intemediários. 
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Entretanto, os erros intermediários podem, algumas vezes, cancelar-se uns com os outros no mínimo 
parcialmente. Em outros casos (tal como em processos iterativos) os erros intermediários podem ter um 
efeito desprezível no resultado final. Algoritmos com essa propriedade são chamados estáveis. 

Instabilidade Numérica ocorre se os erros intermediários tem uma influência muito grande no 
resultado final. Veremos esse fato através do seguinte exemplo. 


Exemplo 2.17 - Resolver a integral: 


1 
lh = e / q”e” dz. 
0 


Solução: Vamos tentar encontrar uma fórmula de recorrência para In. Integrando por partes, segue que: 


1 
Tp = e (lote | n gte” dz) 
0 
1 
= tone! f r'e” dg 
0 


= l-n n1. 
Assim, obtemos uma fórmula de recorrência para In, isto é: 
In = l-n In, n=1,2,..., (2.4) 
e desde que: i 
Io = e= f e” de = el(e-1) = 0.6321, 
0 
é conhecido, podemos, teoricamente, calcular Ip, usando (2.4). Fazendo os cálculos, obtemos: 


Io = 0.6321, 1 = 0.3679, 1 = 0.2642, 1 = 0.2074, 


I4 = 0.1704, 15 = 0.1480, 16 = 0.1120, Iz 0.216. 


O resultado obtido para Iy está claramente errado, desde que: 


1 
1 
Iz <e! max (e”) J z” dz < — , 
0<z<1 0 n+1 
1 = 


isto é, ly < q 0.1250. Além disso a sequência 1, é uma sequência decrescente. Para ver que a 
instabilidade existe, vamos supor que o valor de Tọ esteja afetado de um erro eo. Vamos supor ainda que 
todos as operações aritméticas subsequentes são calculadas exatamente. Denotando por 1, o valor exato 
da integral e por 1, o valor calculado assumindo que só existe erro no valor inicial, obtemos que: 


lo =h+e, 


e assim: . 
In = Liidri n=1,2..... (2.5) 


Seja rn o erro, isto é: 
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Subtraindo de (2.5), segue que: 


Ta = "nr, n=1,2..... 
Aplicando essa fórmula repetidamente, obtemos: 
2 n 
Tn => = (=n) fn-2 =. =(-nro, 


e portanto 

Tn = (=n)” €0 , 
desde que ro = €o. Assim, a cada passo do cálculo, o erro cresce do fator n. Surge então a pergunta: Como 
encontrar o valor exato de 1,? Para este caso em particular, observe que: uma relação de recorrência 
ser instável na direção crescente de n não impede de ser estável na direção decrescente de n. Assim, 
resolvendo (2.4), para In—1, obtemos: 

1-1 
Fai = (Im) n) E (2.6) 
n 
Se usada nessa forma, a relação também precisa de um valor inicial. Entretanto, não é fácil encontrar 
esse valor pois todo 1, onde n > 0 é desconhecido. Mas sabemos que 1, — 0 quando n > œo. Assim, 
tomando Izo = 0 e usando (2.6) para n = 20, 19,18,..., obtemos: Iy = 0.1123835 onde agora todos os 
dígitos estão corretos. E interessante notar que começando com Iy = 0, obtemos Io = 0.6320. Isto ocorre 
porque neste caso o erro está sendo reduzido substancialmente a cada passo, isto é, a cada passo o erro 
1 


decresce do fator z- 


2.5.4 Mal Condicionamento 
A maioria dos processos numéricos seguem a seguinte linha geral: 
e Dados são fornecidos, 
e Os dados são processados de acordo com um plano pré-estabelecido (algoritmo), 
e Resultados são produzidos. 


Analisaremos aqui problemas onde os resultados dependem continuamente dos dados. Tais problemas 
são chamados de problema bem posto. Problemas que não dependem continuamente dos dados são 
chamados de problema mal posto. 

Vamos então analisar como pertubações nos dados podem ou não influenciar os resultados. 


Exemplo 2.18 - Resolver o sistema: 


Lo + Y = 2 
i x + 1.0ly = 2.01 

Solução: A solução desse sistema pode ser facilmente obtida, por exemplo, por substituição. Fazendo 
isso, obtemos: x = y = 1. Se o número 2.01, da segunda equação é mudado para 2.02, obtemos que a 
solução do sistema é agora x=0 e y=2. Portanto uma pequena mudança nos dados produz uma grande 
mudança no resultado. Vamos então interpretar geometricamente o resultado. A solução do sistema é 
o ponto de interseção das duas retas: y = 2-x e y = (2.01 -x)/1.01. Essas retas estão desenhadas na 
Figura 2.1. É claro que o ponto de interseção é muito sensível a pequenas pertubações em cada uma 
dessas retas desde que elas são praticamente paralelas. De fato, se o coeficiente de y na segunda equação 
é 1.00, as duas retas são exatamente paralelas e o sistema não tem solução. Isto é típico de problemas 
mal condicionados. Eles são também chamados de problemas críticos, pois ou possuem infinitas soluções 
ou não possuem nenhuma. 
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(1,1) 


y = (2.01 — «)/1.01 
yv=2-2 


— 


Figura 2.1 


Exemplo 2.19 - Determinar a solução do problema de valor inicial: 


onde a e b são dados. 


Solução: A solução teórica desse problema de valor inicial é: 


ylz) = Cie? + Coe *, (2.7) 
onde C4 e €5 dependem de a e b. Assim, se tomarmos a = 1 e b = —l, então desde que y'(x) = 
Cie” — Coe”, obtemos o sistema linear: 

y(0) = Ci+C: = 1 

y'(0) = Cı — C2 = — 


cuja solução é: Cı = 0 e Ca = 1. Substituindo esses valores em (2.7) obtemos que y(x) = e7”. Logo, 
quando x — oco a solução decresce rapidamente para zero. Mas se tomarmos a = 1 e b = —1 + ô, onde |ô] 
pode ser arbitrariamente pequeno, então, como anteriormente, obtemos o sistema linear: 


Ci+C = 1 
C—-C = —I+ô6 
cuja solução é: C1 = 9 eC,=1- A Assim a solução do novo problema de valor inicial é: 
ô ô ô 
y(x) = ze +(1-— pe” =e “+ ze —eN=e?+ôsenha. 


Portanto a solução difere da solução do problema anterior de ô senh x. Assim a característica 
matemática da solução foi mudada completamente, pois enquanto no primeiro resultado a solução — 0, 
quando x — oo ela agora — œo quando x — oo. Tudo isso ocorreu apesar da dependência de y(x) sobre 
os dados a e b ser claramente contínua. 

Torna-se então necessário introduzir uma medida para o grau de continuidade de um problema. Tal 
medida é essencial em muitas definições de continuidade. Seja X o espaço dos dados; os elementos x 
de X podem ser números, pontos de um espaço euclidiano, vetores, matrizes, funções, etc.... Podemos 
então falar em continuidade se pudermos ser capazes de medir a distância entre os elementos de X. 
Suponhamos que o espaço X está dotado com uma função distância d(x, y) que mede a distância entre 
os elementos x e y de X. Se por exemplo, X é o espaço dos números reais, a função distância é definida 
por: d(x,y) = |x — y|. Para X = IR”, veja Definição 1.7. 
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Seja P o processo nos quais os dados x são transformados no resultado y, isto é: y = P(x). Se o 
processo P é contínuo num ponto x, então a definição de continuidade (matemática) exige que para cada 
e>0, 3 ó(e) > 0 tais que: 


IP(x) — P(x)| < e sempre que |Z — «| < (e). 


Quanto maior a função ó(e) pode ser escolhida, mais contínuo é o processo P. No caso em que grandes 
mudanças nos dados produzem somente pequenas mudanças nos resultados, ou se d(e) pode ser escolhido 
grande, a condição do problema é boa, e o problema é chamado bem condicionado. Por outro lado, se 
pequenas mudanças nos dados produzem grandes mudanças nos resultados, ou se d(e) deve ser escolhido 
pequeno, a condição do problema é má, e o problema é chamado mal condicionado. 


Exemplo 2.20 - Analisar o problema de valor inicial do exemplo 


Solução: Se queremos que a solução y(x) num ponto x seja mudada por não mais Ed uma quan- 
tidade e, então a condição inicial y'(0) = —1 deve ser mudada por não mais que: ó(e 

qual pode ser feito arbitrariamente pequeno escolhendo x grande. Por exemplo para x = 10, sE e 
ô(e) = 0.9 x 1074 e. Assim temos um problema mal condicionado. 


Podemos também verificar se um problema é ou não mal condicionado analisando o número de 
condição do problema. O problema será bem condicionado se o número de condição for pequeno e será 
mal condicionado se o número de condição for grande. Entretanto a definição de número de condição 
depende do problema. 


Seja y = P(x), com P diferenciável. Então a mudança em y causada pela mudança em x pode ser 
aproximada, (no sentido do cálculo diferencial) pelo diferencial de y, isto é: dy = P'(x) dx. Assim o 
comprimento de |P'(x)| do operador linear P(x) representa o número de condição do problema num 
ponto x. O número de condição relativa é definido por: 


C& = |. 


[P(ax) 


Assim se cy < 1 dizemos que o problema é relativamente bem condicionado. 


Exemplo 2.21 - Analisar o problema de calcular: 


num ponto x qualquer. 


Solução: Desde que f é diferenciável o número de condição é simplesmente |f'(x)|. Assim: 


ro = An SUE 
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e o número de condição relativa é dada por: 


8x In 1 

Para x = 0, e x = 1 tanto o número de condição como o número de condição relativa são infinito, e 
assim nestes pontos o problema é extremamente mal condicionado. Para aproximadamente 0.1537 < x < 
0.5360, cr < 1. Portanto neste intervalo o problema de calcular f é bem condicionado. 

O problema de resolver um sistema linear, como vimos, é um outro exemplo de problema onde 
pequenas pertubações nos dados podem alterar de modo significativo o resultado. A análise do problema 
de mal condicionamento de sistemas lineares, encontra-se no Capítulo 4. 

Teoricamente, o termo mal condicionado é usado somente para modelos matemáticos ou problemas 
e o termo instabilidade somente para algoritmos. Entretanto, na prática os dois termos são usados sem 
distinção. 

O leitor interessado em maiores detalhes sobre os tópicos apresentados nesse capítulo, deve consultar 
os livros: [Forsythe, 19 .. ] e [Henrice, 1982]. 


Exercícios 
2.13 - Considere a integral do exercício 2.13, com a = 10. 
a) Calcule yo usando a integral. 


b) Mostre que uma relação de recorrência para yn é dada por: 


1 
Yn = —— QA Yn-1. 
n 
c) Calcule yn, n= 1,2...,10, usando a relação de recorrência. 


Os valores obtidos são confiáveis? 


2.14 - Considere agora a relação de recorrência do exercício anterior escrita na forma: 


Considere ainda que y2ọ = O. Usando este dado e a relação de recorrência obtenha os valores de 
Y10;Y9;---, Yı- Os resultados agora são melhores? Como você explica isso? 
2.6 Exercícios Complementares 


2.15 - Dados os números: (13.44)5, (122.35), (31.202)4. Existe algum com representação exata no 
sistema F(2,10,10,10)? 


2.16 - Considere o sistema F(2,8,4,4) e os números x, = 0.10110011 x 22 e x= 0.10110010 x 22. 
Qual dos dois números representa melhor (2.8)10? 


2.17 - Seja o sistema F(2,3,-1,2). Exiba todos os números representáveis neste sistema e coloque-os 
sobre um eixo ordenado. 
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2.18 - Considere o sistema F(2,8,10,10). Represente no sistema os números: 
xı = V8, £2 = e°, £3 = 3.57, onde todos estão na base 10. Existe algum com representação exata nesse 


sistema? 


2.19 - Mostre que se x é um número no sistema F(B,t;m, M) então x = x(1+ ô) onde |ô| < T 


2.20 - Mostre que K é o melhor limitante para |ô]. 
2.21 - Efetue as operações indicadas, utilizando aritmética de ponto flutuante com 3 algarismos signi- 
ficativos. 


a) (19.3 — 1.07) — 10.3 e 19.3- (1.07 + 10.3) , 


b) 27.2 x 1.3 — 327. x 0.00251 , 


) 10.1 — 3.1 x 8.2 
14.1 +7.09 x 3.22 ’ 


d) (367. +0.6)+0.5 e 367. + (0.6 + 0.5) , 


e) NoN 0.11 . (Compare seu resultado com 100 x 0.11) . 
2.22 - Deseja-se calcular: 
10 9 
Ee 
k=1 
no sistema F(10,3,5,4), usando arredondamento em todas as operações. Assim, efetue a soma: 
a) da direita para a esquerda, 
b) da esquerda para a direita, 
Os valores obtidos em a) e b são iguais? 


2.23 - Usando arredondamento para 4 dígitos significativos, efetue as operações indicadas, e escreva o 
resultado na forma normalizada. 


a) 0.5971 x 103 + 0.4268 x 10° , 
b) 0.5971 x 1071 — 0.5956 x 1072 , 


c) [0-5971 x 10° 
0.4268 x 1077 * 


d) (0.5971 x 103) x (0.4268 x 10º), 


2.24 - Usando arredondamento, a cada operação efetuada, calcule: 


n n 

2 2 
J K J P 
i=1 i=2 


somando os termos em: 
a) ordem crescente, 


b) ordem decrescente. 
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Considere n = 100. Os valores obtidos são iguais? 
2.25 - Deseja-se calcular e7®™t5. 


a) Obtenha através de uma calculadora o valor exato de e 815, 


b) Considere o sistema F(10,5,10,10) e a série truncada em 25 termos. Calcule: 


b.1) e7015 


1 
b.2) 0:15 


e compare os resultados. 


2.26 - Se a,b e c são reais e a £0, então a equação 


ax +br+tc=0, 


é satisfeita para exatamente dois valores de x: 


= b+ ve —4ac 
a , 


Tı 
(1) 
—b — 2 — 
RAE b La 4ac. 


Entretanto, desde que a x? +b x +c = a (x — xı) (x — £2) obtemos que: ax; xo = ce assim 


podemos reescrever (I) na seguinte forma: 


b + sinal de (b) Vb? — 4ac 
dado, om Za , 
(I) 
L = E , 


E" —2 c 
sa b + vb — 4ac’ 
(III) 
Na = ET 


Utilizando (I), (II) e (III) calcule as raízes das equações para os valores de a,b e c dados a seguir: 
i)a = 1; b= 10; c=1, 
ii) a = 1; b = 4: c = 3.9999999 , 
iii) a = 6; b= 5; c= —4. 
2.27 - A função de Bessel satisfaz a seguinte relação de recorrência: 
is ZT (4) rats 


Se x = 1, Jo(l) = 0.7652 e Jı(1) = 0.4401, calcule Jn(1) para n = 2,3,...,10. Refaça os cálculos 
começando com valores mais precisos: Jo(1) = 0.76519769 e J(1) = 0.44005059. Como você explica 


seus resultados com o fato que Jn(1) — O quando n cresce? 
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2.28 - Faça Jıo(1) = 0 e Jo(1) = u. Use a fórmula do exercício anterior, na forma: 
Jn-1(1) = 2 nahl) — Jn (1) 
e calcule Js(1), Jz(1),.... Encontre u através da identidade: 
Jo(£) +2 Ja(£) +2 Ja(x) +2 Jo(a) +... = 1, 


e calcule Jo(1), Ja(1),..., Jo(1). Como esses resultados se comparam com os valores exatos? 


Capítulo 3 


Equações não Lineares 


3.1 Introdução 


Um dos problemas que ocorrem mais frequentemente em trabalhos científicos é calcular as raízes de 
equações da forma: 


onde f(x) pode ser um polinômio em x ou uma função transcendente. Em raros casos é possível ob- 
ter as raízes exatas de f(x) = 0, como ocorre por exemplo, supondo-se f(x) um polinômio fatorável. 
Através de técnicas numéricas, é possível obter uma solução aproximada, em alguns casos, tão próxima 
da solução exata, quanto se deseje. A maioria dos procedimentos numéricos fornecem uma sequência de 
aproximações, cada uma das quais mais precisa que a anterior, de tal modo que a repetição do proce- 
dimento fornece uma aproximação a qual difere do valor verdadeiro por alguma tolêrancia pré-fixada. 
Estes procedimentos são portanto muito semelhantes ao conceito de limite da análise matemática. Va- 
mos considerar vários métodos iterativos para a determinação de aproximações para raízes isoladas 
de f(x) = 0. Será dada uma atenção especial às equações polinomiais em virtude da importância que as 
mesmas gozam em aplicações práticas. 
Inicialmente recordemos um importante resultado da Álgebra. 


Teorema 3.1 - Se uma função contínua f(x) assume valores de sinais opostos nos pontos extremos do 
intervalo [a,b], isto é, se f(a) x f(b) < 0, então existe pelo menos um pontoz € [a,b], tal que 


f(x) = 0. 
Prova: A prova deste teorema pode ser encontrada em |.. , 19..] 


Definição 3.1 - Se f : [a,b] > IR é uma função dada, um ponto Z € [a,b| é um zero (ou raiz) de f se 


f(5) =0. 
Ilustraremos graficamente esses conceitos nos exemplos a seguir. 
Exemplo 3.1 - Seja f : (0,00) — IR. Determinar as raízes de f(x) =ln z. 


Solução: O gráfico de In x é dado na Figura 3.1. 
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Figura 3.1 


Nesse caso vemos que f(0.5) x f(1.5) < 0. Portanto existe uma raiz de f(x) no intervalo (0.5,1.5). 
Além disso a curva intercepta o eixo dos x num único ponto, pois trata-se de uma função crescente. Então 
z= 1 é a única raiz de f(x) = 0. 


Exemplo 3.2 - Seja f : (0,00) — IR. Determinar as raízes de f(x) = e”. 


Solução: O gráfico de e” é dado na Figura 3.2. 


1 2 


Figura 3.2 


Nesse caso vemos a curva não intercepta o eixo dos x, logo não existe 7 tal que f(x) = 0. 
Exemplo 3.3 - Seja f : [0,27] > IR. Determinar as raízes de f(x) = cos x. 


Solução: O gráfico de cos x é dado na Figura 3.3. 


COSL 


» 


Figura 3.3 
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Nesse caso vemos que: f(1) x f(2) < 0 e f(4) x f(5) < 0, ou seja a curva intercepta o eixo dos x 
em dois pontos. Assim temos uma raiz Z no intervalo (1,2) e outra no intervalo (4,5). Sabemos da 
trigonometria que: 7 = 5 = 1.5708 e 3 = 37 = 4.7124 são raízes de f(x) = 0. 


Definição 3.2 - Um ponto z € [a,b] é uma raiz de multiplicidade m da equação f(x) = 0 se f(x) = 
ESP gn) com s6AO em o, 


Exemplo 3.4 - Seja f : IR —» IR. Determinar as raízes de f(x) = x? +2 £ +1=(x+1)2=0. 


Solução: O gráfico de f(x) é dado na Figura 3.4. 


81 
(x + 1 
1) 
4 + — 
—3 —1 1 
Figura 3.4 
Nesse caso vemos que a curva apenas toca o eixo dos x. Assim, g = 1 é raiz de multiplicidade 2 de 


Ha) =0. 


Como vimos nos exemplos anteriores, podemos obter o número exato de raízes e sua localização exata 
ou aproximada traçando o gráfico da função e encontrando o ponto onde a curva intercepta o eixo dos q. 
Entretanto algumas vezes é mais conveniente rearranjar a equação dada como y (x) = y2(x), para duas 
funções yı e y2, cujos gráficos são mais fáceis de serem traçados do que o da f. As raízes da equação 
original são dadas então pelos pontos onde o gráfico de yı intercepta o de y2. Ilustraremos este fato no 
próximo exemplo. 


Exemplo 3.5 - Seja f : IR > IR. Determinar as raízes de f(x) = (x +1)? e) —1 =0. 
Solução: Podemos rearranjar a equação dada, por exemplo, como: 
(x+1)2= e=), 


Fazendo y = (x +1)? , y2 = e2-2º) e colocando as duas curvas no mesmo gráfico, obtemos a Figura 
3.5. 
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Figura 3.5 


E claro observando-se a Figura 3.5 que as duas curvas se interceptam apenas duas vezes. Portanto 
a equação dada tem precisamente duas raízes. Uma raiz X no intervalo (—2, —1) e outra no intervalo (0, 1). 


Este último exemplo ilustra bem a razão da utilização de métodos númericos para determinar a solução 
de equações não lineares. Ao contrário dos exemplos anteriores, onde foi razoavelmente fácil determinar 
as raízes da função dada, aqui fica difícil dizer com exatidão qual é o valor de g tal que f(x) = 0. 

Para descrevermos um método numérico extremamente simples, e de fácil compreensão, suponha que 
f(x) seja uma função contínua em [a,b]. Pelo Teorema [8.1] temos que se f(x) em x =a ex = b tem 
sinais opostos, então f(x) tem no mínimo um zero em fa, b|. Esse resultado fornece um caminho simples, 
mas efetivo. para encontrar a localização aproximada dos zeros da f. Considere novamente a equação do 
exemplo [3.5] isto é, f(x) = (x + 1)? e°- — 1. Valores de f(x) para £ = —3,-2,...,3 estão contidos 
na tabela a seguir: 

z | -3 -2 -1 0 1 2 3 
f(x) | 4385.5 6.4 —1.0 —0.9 0.5 65.5 175451 


A função portanto possui zeros no intervalo [—2,—1] e [0,1]. (Note que o mesmo resultado foi obtido 
graficamente). Estamos agora em condições de descrever um método numérico, conhecido como Método 
da Bissecção, o qual reduz o comprimento do intervalo que contém a raiz, de maneira sistemática. 

Considere o intervalo [a,b] para o qual f(a) x f(b) < 0. No método da bissecção calculamos o valor 


apo, Portanto existem três possiblidades. Primeiramente, fi- 


da função f(x) no ponto médio: xy = 
caríamos felizes, (embora seja quase impossível), se o valor da função calculado no ponto x fosse nulo, 
isto é: f(x1) = 0. Nesse caso x, é o zero da f e não precisamos fazer mais nada. Em segundo lugar, se 
f(a) x f(x1) < 0, então f tem um zero entre a e zı. O processo pode ser repetido sobre o novo intervalo 
[a, xı]. Finalmente, se f(a) x f(x1) > 0, segue que f(b) x f(x1) < 0, desde que é conhecido que f(a) e 
f(b) têm sinais opostos. Portanto f tem um zero entre xı e b, e o processo pode ser repetido com [x1,b). 
A repetição do método é chamado iteração e as aproximações sucessivas são os termos iterados. Assim, 
o método da bissecção pode ser descrito como: 


Para k = 1,2,..., faça: 


<0 então b= Tk, 


Se f(a) x f(xx) 


>0 então a= Tk 


Uma interpretação geométrica do método da bissecção é dada na Figura 3.6. 
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F(b) 


T3 Tı 


fa) 
Figura 3.6 


Para ilustrar o método da bissecção, considere que desejamos calcular a raiz positiva da equação do 
Exemplo iniciando com o intervalo [0,1]. Para essa equação temos que f(0) < 0e f(1) > 0. O 
ponto médio é xı = 0.5, com f(x1) = —0.6090086. Desde que f(0) x f(0.5) > 0, deduzimos que a raiz da 
equação está em [0.5, 1]. Os primeiros passos do método da bissecção, para esta equação, estão mostrados 
na tabela: 


k a b Tk f(x) 
1 0 1 0.5 -0.609009 
2 0.5 1 0.75 -0.272592 
4 0.75 1 0.875 0.023105 
4 0.75 0.875 0.8125 -0.139662 
5 0.8125 0.875 0.84375 -0.062448 
6 0.84375 0.875 0.859375 -0.020775 


Continuando o processo obteremos: x16 = 0.866868 e xzı7 = 0.866876. Isso significa que o intervalo 
incial [0,1] foi reduzido ao intervalo[0.866868, 0.866876], e portanto a raiz positiva da equação dada é 
aproximadamente: x = 0.86687. Note que até agora não falamos como devemos proceder para obter o 
resultado com uma quantidade de casas decimais corretas. Isso será discutido mais adiante. 


Exercícios 


3.1 - Dadas as funções: 
a) 22+327-1=0, 
b) 7º -senz=0, 
pesquisar a existência de raízes reais e isolá-las em intervalos. 
3.2 - Justifique que a função: 


1 
T+ 0,148 z — 0.9062 , 
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possui uma raiz no intervalo (—1,0) e outra no intervalo (0,1). 


Existem vários métodos numéricos para determinação (aproximada) das raízes da equação f(x) = 0, 
mais eficientes que o método da bissecção. Descreveremos a seguir alguns desses métodos, discutindo suas 
vantagens e desvantagens. Antes, porém, daremos um procedimento que deve ser seguido na aplicação 
de qualquer método numérico para determinar um zero de f(x) = 0, com uma precisão pré-fixada. 


Processo de Parada 


1) Para aplicar qualquer método numérico deveremos ter sempre uma idéia sobre a localização da 
raiz a ser determinada. Essa localização é obtida , em geral, através de gráfico. (Podemos também 
localizar o intervalo que contém a raiz fazendo uso do Teorema [8.1). A partir da localização da 
raiz, escolhemos então xy como uma aproximação inicial para a raiz z de f(x) = 0. Com essa 
aproximação inicial e um método numérico refinamos a solução até obtê-la com uma determinada 
precisão (número de casas decimais corretas) . 


2) Para obtermos uma raiz com uma determinada precisão e devemos, durante o processo iterativo, 
efetuar o seguinte teste: Se 
Tk+1 — Tk è 
anta — zx] <e,(erro relativo), 
|+| 
onde e é uma precisão pré-fixada; £k e zk4+1 são duas aproximações consecutivas para Z, então 
Zk+1 é a raiz procurada, isto é, tomamos T = tp41. 


Observações: 


a) Em relação à precisão pré-fixada, normalmente tomamos e = 107” onde m é o número de casas 
decimais que queremos corretas no resultado. 


b) Apesar de alguns autores considerarem como teste de parada o fato de |f(£k+1)| < €, é preciso ter 
muito cuidado pois a menos que se tenha uma idéia muito clara do comportamento da função o fato 
desse teste ser satisfeito não implica necessariamente que x+,1 esteja próximo da raiz procurada, 
como pode ser observado no seguinte exemplo: considere f(x) = x? Ing = 0, onde a única raiz 
é x = 1. Calculando f(x) para x = 2,4,8,16,32,... obtemos, respectivamente: 0.0866, 0.0217, 
0.00406,0.0006769,0.0001058,... isto é, quanto mais longe estamos de z, menor é o valor de f(x). 


c) Alguns autores consideram como teste de parada o fato de |£k+1 — £k| < €, chamado de erro 
absoluto. Entretanto, se esses números forem muito grandes e e for muito pequeno, pode não 
ser possível calcular a raiz com uma precisão tão exigente. Como exemplo, resolva a equação 
f(x) = (x — 1)(x — 2000) = 0 com e = 104 usando os critérios de erro relativo e erro absoluto. 
Você irá verificar que o número de iterações é muito maior para o critério do erro absoluto. Isso 
ocorre porque a raiz que estamos procurando tem módulo grande e portanto é muito mais difícil 
tornar o erro absoluto menor do que e. 


Quando fazemos um programa computacional, devemos considerar o erro relativo escrito na seguinte 
forma: 
|Ek+1 — T| < ex max{1, |zk+1]} ; 


pois se |x,1| estiver próximo de zero o processo não estaciona. Além do teste do erro relativo, devemos 
colocar um número máximo de iterações pois se o programa não estiver bem, ou se o método não se 
aplicar ao problema que se está resolvendo, o programa entrará em looping. 
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3.2 Iteração Linear 


A fim de introduzir o método de iteração linear para o cálculo de uma raiz da equação: 


f(z) = 0, (3.1) 
onde f(x) é uma função contínua num intervalo que contenha a raiz procurada, expressamos, inicialmente, 


a equação na forma: 
xz = y(x), (3.2) 
de maneira que qualquer solução de seja, também, solução de (8.1). Para qualquer função 1), 
qualquer solução de é chamada de ponto fixo de y(x). Assim, o problema de determinar um zero 
de f(x) foi transformado no problema de determinar o ponto fixo de y(x), e essa transformação não deve 
alterar a posição da raiz procurada. 
Em geral, há muitos modos de expressar f(x) na forma (8.2). Basta considerarmos: 


blz) = z+ A(x) Ha), 


para qualquer A(x) tal que A(z) # 0. 
Nem todas, porém, serão igualmente satisfatórias para as nossas finalidades. 
Algumas formas possíveis da equação: 


fla) = 2º-2-2 = 0; (3.3) 
cujas raízes são -1 e 2, por exemplo, são: 
a) x = = c) r =1+2 
2 
b) x = y2+r d) z = r- r8 m #0. 


É claro, que não necessitamos de um método númerico para calcular as raízes de uma equação do 
segundo grau, contudo esse exemplo ilustrará de maneira objetiva os nossos propósitos. 

Como já dissemos anteriormente, geometricamente, tem como solução a intersecção do gráfico 
da f com o eixo x, enquanto que uma raiz de é um número 7, para o qual a reta yı = x intercepta 
a curva y2 = (x). Pode ocorrer, naturalmente, que estas curvas não se interceptem, caso em que 
não haverá raiz real. Admitiremos, contudo, que essas curvas se interceptem no mínimo, uma vez; que 
estamos interessados em determinar uma dessas raízes, digamos Z, e que W(x) e Y'(x) sejam contínuas 
num intervalo que contenha essa raiz. 

Seja zo uma aproximação inicial para a raiz g de (8.2). Obtemos as aproximações sucessivas xy para 
a solução desejada Z, usando o processo iterativo definido por: 


Tk+1 = Wp (£k), k = 0,1,.... (3.4) 


Esse processo é chamado Método Iterativo Linear. 
Para que esse processo seja vantajoso, devemos obter aproximações sucessivas zk, convergentes para 
a solução desejada z. Contudo, é fácil obter exemplos para os quais a sequência x; diverge. 


Exemplo 3.6 - Considerando em E £z = xz? —2 e tomando xo = 2.5, determinar a raiz T = 2. 
Solução: Usando (3.4), obtemos: 

zı = Y(zo) = r — 2 = (2.5) —2 = 4.25 

r2 = (zı) = xz? — 2= (4.25)?—2 = 16.0625 

z3 = blza) = z — 2 = (16.0625)?—2 = 256.00391 
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e é óbvio que se trata de uma sequência divergente. Assim, a escolha de y(x) = x? — 2 não produz um 
processo iterativo que seja convergente. 


As condições suficientes que a função p(x) deve satisfazer para assegurar a convergência da iteração 
linear estão contidas no Teorema [3.4] Vejamos antes dois teoremas que serão utilizados na prova desse 
Teorema. 


Teorema 3.2 - Teorema do Valor Médio - Se f é contínua em [a,b] e diferenciável em (a,b) então 
existe pelo menos um ponto É entre a e b tal que: 


FO) — Ha) 


pa ° istoé, Hb) fla) = f'E- a). 


FE = 
Prova: A prova deste teorema pode ser encontrada em [Swokowski,1983]. 


Teorema 3.3 - Teorema da Permanência do Sinal - Seja f uma função real de variável real definida 
e contínua numa vizinhança de xo. Se f(xo) £ 0 então f(x) £ O para todo x pertencente a um vizinhança 
suficientemente pequena de xo. 


Prova: A prova deste teorema pode ser encontrada em [Swokowski,1983]. 


Teorema 3.4 - Seja y(x) uma função contínua, com derivadas primeira e segunda contínuas num in- 
tervalo fechado I da forma I = (z — h, + h), cujo centro © é solução de x = y(x). Seja xvoE I e M 
um limitante da forma, |y'(x)) < M < 1 em I. Então: 


a) a iteração tp, = Y(£k), k=0,1,..., pode ser executada indefinidamente, pois zp € I, V k. 
b) lx — z| > 0. 
c) Sey (z) #0 ou Y'(z)=0 e d(x) #0 ese |xo-— T| for suficientemente pequeno então a 


sequência z1, £2,... será monotônica ou oscilante. 


Prova: 

a) Usaremos indução para provar que xp € I, V k. 
i) Por hipótese xo € T. 

ii) Supomos que zo, %1,..., £k ET. 


iii) Provemos que 7,1 € I. Temos: 


k41 — 7 = Y (zk) — 4 (2). 


Usando o teorema do Valor Médio, obtemos: 
Tey =T = W' (Ek) (£k — T) 
onde £p está entre x e z. Tomando módulo, segue que: 
zum — Z| = [V (€x) xx -z| < Mx — z| 
desde que pela hipótese de indução x, E€ I > p € I e sobre T, |ẹọ'(x)| < M < 1. Assim: 


|£k+1 = T| < M|zk = z|. 
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Como M < 1, temos que xk+,1 E I. 
b) Pelo item a) temos que: 


|z -Z| < Mļ|ek-1 -Z| < M? |zk-2 -2| <... < M'r-z 


Como M < 1, passando ao limite, obtemos: 


lim Mº > 0 e portanto |z- ē| >0. 


k—oo 


c) Aqui dividiremos a prova em duas partes. Assim: 
c.1) Seja y’ (z) £ 0. 


Pelo Teorema da Permanência do Sinal temos que numa vizinhança de % suficientemente pequena, 
W'(x) terá o mesmo sinal. Assim de: 


Tri —>T =Y (Ek) (£k — 7) , 
temos que: 


Tk S< T > Tk} L T 
(I) Sew(z) > 0 e 


8 
= 
Iv 
BI 


> le 2 T 


8 
E 
IA 
8 


T = Ty Z T 
(II) Se y'(z) < 0 e 


8 
= 
IV 


T => ti CT 


Como |£ — Z| — 0, a convergência será monotônica em (I) e em (II) será oscilante em torno de Z. 
c.2) Seja y(z) =0 e W(x) £0. 
Usando o teorema do Valor Médio, temos que: 
Y (Er) = Ué) — WE) = YO) lE- E), 
onde 0, está entre ék e gz. Assim: 
tr — T= Y" (Ok) (Ek — E) (£k — 2). 


Pelo teorema da Permanência do Sinal, Y” (x) terá o mesmo sinal numa vizinhança suficientemente 


pequena de x. Como (Ep — T) (£k — T) > 0, pois é e xy encontram-se do mesmo lado de Z, segue que, se: 
v(T)>0 > Tku 2? 7, Vk, 


p(z) <0 > Tkp S< 7, Vk. 
Neste caso a sequência £1, £2, 


... será monotônica independente do sinal de xo — z. Isso completa a 
prova do Teorema [3.4] 


Consideremos novamente a equação (3.3). Se nosso objetivo é encontrar a raiz Z = 2, usando o 
problema de ponto fixo equivalente (3.3.a), teremos: 


r = z —2 = (a). 
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Para que o processo £k+}1 = T —2 seja convergente devemos ter |1)'(x)| < 1 na vizinhança de Z = 2. 
Temos que W'(x) = 2x, e desde que |y'(x)| > 1 para z > à, o Teorema |3.4| não pode ser usado para 


garantir convergência. Entretanto, a iteração £k+1 = g? — 2 divergirá para qualquer escolha de zo > - 
como vimos anteriormente. 
Por outro lado se usarmos o problema de ponto fixo (3.3.b), teremos y(x) = V2 + x, e assim y'(x) = 


NITA Portanto |Y’ (x)| < 1 , se e somente se z > —1.75. Assim, pelo Teorema f3.4] podemos crer que 
a iteração: 


Th = V2+ Tk, 


será convergente para qualquer escolha de xy > —1.75, como pode ser observado no próximo exemplo. 
Exemplo 3.7 - Considerando em (8.9), xz = v2+x etomando zo = 2.5, determinar a raiz X = 2. 


Solução: Tomando zo = 2.5, obteremos a sequência de aproximações: 


= v2+2.5 = v4.5 = 2.1213208 
= 24 2.1213203 = v4.1213203 = 2.0301035 
z2) = v2+2.0301035 = v4.0301035 = 2.0075118 


(xo) 
(x1) 
(x2) 
z4 = Was) = v2+2.0075118 = v4.0075118 = 2.0018771 
(x4) 
(x5) 
(x6) 


Tı 


= v2+2.0018771 = v4.0018771 = 2.0004692 
= v2 + 2.0004692 = v4.0004692 = 2.0001173 
= v2+2.0001173 = v4.0001173 = 2.0000293 


T4 


T5 


T6 


a qual é, obviamente, convergente para a raiz g = 2. Este exemplo ilustra, também, a importância da 


disposição apropriada de (3.1) na forma (3.2). 


Uma ilustração geométrica da não convergência e da convergência do método iterativo £k+1 = Y(xy) 
em ambos os casos: £k}1 = £? —2 e zh, = V2 + é dada pelas Figuras 3.7 e 3.8, respectivamente. 
Observe que em cada uma das figuras, escolhido o ponto xo caminhamos verticalmente até encontrar a 
curva (x); em seguida caminhamos horizontalmente até encontrar a reta y = x, e finalmente caminha- 
mos verticalmente até encontra o eixo dos x onde estará localizado o ponto xı. O processo é repetido 
partindo-se de zı, e assim sucessivamente. Temos então: 


a) paraz = 12-02: 
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20 + 
q — 9 
P, TN 
15 + ' 
l 
10 + 
l 
l 
l x 
gi Rs uns | 
l 
bg E 
1 Tt To 3 Ti 5 
Figura 3.7 
b) parax = v2+a: 


1 Tri To 3 


Figura 3.8 


Representamos na Figura 3.7 os pontos: Po: (zo, Y (zo)), Pr: (x1, Y (£1)), etc. Estes pontos estão, 
obviamente, afastando-se da interseção das duas curvas y = £ e y2 = W(x), e, ao mesmo tempo, £p está 
se afastando de z. Na Figura 3.8, os pontos P), P,, etc. estão, obviamente, aproximando-se do ponto de 
interseção das duas curvas y = x e y2 = (x), e, ao mesmo tempo, x, está se aproximando de Z. 

Assim em a) temos que o processo iterativo é divergente e em b) que o processo iterativo é convergente. 


Ordem de Convergência 
A ordem de convergência de um método mede a velocidade com que as iterações produzidas por 


esse método aproximam-se da solução exata. Assim, quanto maior for a ordem de convergência melhor 
será o método numérico pois mais rapidamente obteremos a solução. Analisaremos aqui a ordem de 
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convergência do método iterativo linear. Antes porém apresentamos a definição de ordem de convergência 
de um método numérico. 


Definição 3.3 - Sejam {xk} o resultado da aplicação de um método numérico na iteração k e ek = Lk—X 
o seu erro . Se existirem um número p > 1 e uma constante c > O tais que: 


lex] _ 
lex? 


então p é chamado de ordem de convergência desse método. 
Teorema 3.5 - A ordem de convergência do método iterativo linear é linear, ou seja, p = 1. 


Prova: Do teorema [3.4] temos que: 


onde £p está entre x e 7. Assim, 


Inn? rel < M. 
lx — z| 


Assim a definição 3.3] está satisfeita com p = 1 e c = M, ou seja a ordem de convergência é p = 1. 
Daí o nome de método Iterativo Linear. Além disso, o erro em qualquer iteração é proporcional ao erro 
na iteração anterior, sendo que o fator de proporcionalidade é y’ (£x). 


Observações: 


a) A convergência do processo iterativo será tanto mais rápida quanto menor for o valor de y’ (x). 


b) Por outro lado, se a declividade (x) for maior que 1 em valor absoluto, para todo x pertencente a 
um intervalo numa vizinhança da raiz, vimos que a iteração xk,1 = Y(xk), k=0,1,..., divergirá. 


c) Da definição [3.3] podemos afirmar que para k suficientemente grande temos: 


leky] = clep, 


jek| = clex-ma). 


Dividindo uma equação pela outra eliminamos a constante c e obtemos: 


p 
Ekri (=) 
€k ek—1 
Assim, uma aproximação para o valor de p pode ser obtido aplicando-se logaritmo em ambos os 
membros da expressão acima. Fazendo isso segue que: 


(3.5) 


Exemplo 3.8 - Com os valores obtidos no exemplo[3.7 verifique que o método iterativo linear realmente 
possui ordem de convergência p = 1. 
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Solução: Do resultado do exemplo [3.7] fazendo os cálculos para os valores de |x.,1 — Z| e usando (3.5), 
obtemos a tabela: 


k k41 = V2 + Tk | €k = |£k — Z| p 
0 2.5 0.5 

1 2.1213203 0.1213203 

2 2.0301035 0.0301035 0.984 
3 2.0075118 0.0075118 0.996 
4 2.0018771 0.0018771 0.999 
5 2.0004692 0.0004692 0.999 
6 2.0001173 0.0001173 0.999 
7 2.0000293 0.0000293 1.001 


Pela tabela vemos que a medida que k aumenta, o valor de p — 1, mostrando que realmente a ordem 
de convergência do método iterativo linear é 1. 


Assim podemos dizer que a importância do método iterativo linear está mais nos conceitos que são 
introduzidos em seu estudo que em sua eficiência computacional. Além disso, tem a desvantagem de que 
é preciso testar se |'(x)| < 1 no intervalo que contém a raiz, se desejamos ter garantia de convergência. 


Exercícios 


3.3 - Justifique que a equação: f(x) = 4 x — e” = 0 possui uma raiz no intervalo (0,1) e outra no 
intervalo (2,3). 


3.4 - Considere a equação f(x) = 2 12 —5 x+2= 0, cujas raízes são: xı = 0.5 e xo = 2.0. Considere 
ainda os processos iterativos: 


2x? +2 
a) cum = EE, 
b ) zm = 2al 


Qual dos dois processos você utilizaria para obter a raiz xı? Por que? 
3.5 - Considere as seguintes funções: 
a) (x) = 220-1, 
b) y(x) 
c) Ya(r) = r? -—3xr+3. 


Verifique que 1 é raiz de todas estas funçôes. Qual delas você escolheria para obter a raiz 1, utilizando 
o processo iterativo ve = Y(£k)? Com a sua escolha, exiba a sequência gerada a partir da condição 
inicial £o = 1.2. 


3.6 - Deseja-se obter a raiz positiva da equação: b x? + x —a = 0,a > 0, b > 0, através do processo 
iterativo definido por: xe = a — b w? .Qual a condição que devemos impor para a e b para que haja 
convergência? Por que? 


3.7 - A equação: x?—a=0 possui uma raiz T= a. Explicar algébrica e geometricamente por que 


a sequência {zp}, obtida através do processo iterativo definido por: Lp = não converge para «/a 
qualquer que seja o valor de xo. 


A 
Th” 
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3.3 Método de Newton 


O método de Newton é uma das técnicas mais populares para se determinar raízes de equações não 
lineares. Existem várias maneiras de deduzir o método de Newton, a que apresentaremos aqui é baseada 
no método de iteração linear. Assim, para descrever tal método, consideremos a equação (3.2), isto é: 


p(s) =x+ Alx) f(z), com f(x)%0, (3.6) 


onde a função A(x) deve ser escolhida de tal forma que A(z) £ 0. 

Vimos pelo Teorema [3.4] que temos garantia de convergência se max|y'(x)| < 1 para x € I. Assim se 
escolhermos A(x) tal que y'(x) = 0, teremos que para x € T, (I suficientemente pequeno), max |y’ (x)| < 1, 
garantindo então a convergência do método. 

Derivando em relação a x, obtemos: 


Wa) = 1 + A(o)fa) + Alx) f'(x). 
Fazendo x = 7, segue que: 
Wa) = 1 + A(z) f(z), pois f(7)=0, 


e colocando: 


W'(x) = 0, teremos A(z) = — mg’ desde que f'(z)#0. 
Tomando então: A(x) = — HOL obtemos y(x) = z — in e o processo iterativo então 
definido por: 
Tk+1 = Tk — Fa (3.7) 


é chamado Método de Newton, que converge sempre que |xo — Z| for suficientemente pequeno. 


Uma interpretação geométrica do método de Newton é dada na Figura 3.9. 


Ha) 


af 


ii x Tk+1 Tk 


Figura 3.9 


Dado zp, o valor x,.,1 pode ser obtido graficamente traçando-se pelo ponto (£k, f(£k)) a tangente à curva 
y = f(x). O ponto de interseção da tangente com o eixo dos x determina xk1. 


CAPÍTULO 3. EQUAÇÕES NÃO LINEARES 69 


De fato, pela lei da tangente: 


f(x) = tga = fee 
> mm = SR > mn a AE. 


Devido à sua interpretação geométrica o método de Newton é também chamado de Método das 
Tangentes. 


Exemplo 3.9 - Determinar, usando o método de Newton, a menor raiz positiva da equação: 
4 cosx — e? = 0, 
com erro inferior a 1072. 


Solução: O processo mais simples e eficaz para se obter um valor inicial é o método gráfico. Com esse 
objetivo dividimos a equação inicial f(x) = 0 em outras duas equações mais simples, que chamaremos 
de y e y2. Note que o rearranjo para obter essas duas equações deve apenas levar em consideração a 
igualdade f(x) = 0. 

Tomando: yı = 4 cos x, y = e”, observe que poderíamos ter tomado yı = cos £ ew = a e 
colocando as duas funções no mesmo gráfico, obtemos a Figura 3.10. 


A 


yı = 4cos x 


1 2 
Figura 3.10 


T EEE 


Como já dissemos anteriormente, o ponto de interseção das duas curvas é a solução % procurada. 
Analisando a Figura 3.10, vemos que 7 está nas vizinhanças do ponto 1.0 e portanto vamos tomar 
zo = 1.0. Por outro lado, da equação original, obtemos: 


flar) = 4 cos tk — e™ ; 
f(x) = —4 sen tp — e”. 


Para efetuar os cálculos seguintes, observe se sua calculadora está em radianos, pois a função dada 
envolve operações trigonométricas. Além disso, como queremos o resultado com erro inferior a 107? basta 
efetuar os cálculos com três casas decimais. Assim: 


f(xo) = f(1.0) = 4 cos (1.0) — et? 
= 4 x (0.540) — 2.718 = —0.557 ; 
f(xo) = f(1.0) = —4 sen (1.0) — et? 


= 4 x (0.841) — 2.718 = —6.084 ; 
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Usando (8.7), obtemos: 


f(1.0) (—0.557) 
= 1.0 > = 1.0 — > = 0.908. 
e fo)” (-6.048) 7 A 
Calculando o erro relativo, temos: 
ZT Tol são: 
Tı 


que é maior que 107?. Devemos fazer uma nova iteração, para tanto calculemos: 


f(x) = (0.908) = 4 cos (0.908) — e!-º08 
= 4 x (0.615) -2.479 = -0.019, 

f(x) = f'(0.908) = —4 sen (0.908) — eº-º08 
= —4 x (0.788)-2479 = —5.631. 


Novamente, usando (3.7), obtemos: 


f(0.908) (—0.019) 
= 0.908 — DD"—+ > = 0.908 — ——— > = 0.905. 
“2 f'(0.908) ” ”? (5.631) 7 7”? 
Calculando o erro relativo, segue que: 
72 71| © 0.0033, 
T2 
ou seja a aproximação x2 = 0.905 possui duas casas decimais corretas. De fato, a solução exata é 


0.9047882. Logo, a menor raiz positiva da equação 4 cos x — e” = 0, com e < 0.01, é z = 0.905. Observe, 
da Figura 3.10, que a raiz encontrada é a única raiz positiva da equação dada. 


Ordem de Convergência 


Analisemos agora a convergência do método de Newton. 


Teorema 3.6 - Se f, f’, f” são contínuas em I cujo centro Z é solução de f(x) =0 e se f(x) #0 então 
a ordem de convergência do método de Newton é quadrática, ou seja, p = 2. 


Prova: Subtraindo a equação z = )(Z) de (3.7), obtemos: 


_ Ha) 
fa) 


Desenvolvendo (x) em série de Taylor em torno do ponto Z, obtemos: 


Tri — Z = p(k) — Y(T) onde y(x) = x 


=2 
= = = = TkT = 
mem — 2 = 40) + aE + EE) -a 
Agora, no método de Newton, )'(x) = 0, (lembre-se que esta condição foi imposta para a determinação 
de A(x)), e portanto: 
lex — 7] _ Y” (Er) 


(Zk — z|? 2! 


<0. 
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Portanto a ordem de convergência é p = 2. 


Assim a vantagem do método de Newton é que sua convergência é quadrática, isto significa que a 
quantidade de dígitos significativos corretos duplica à medida que os valores da sequência se aproxima de 
x. Note que essa correção não acontece em relação às primeiras iterações realizadas. A desvantagem do 
método de Newton está no fato de termos que calcular a derivada da função e em cada iteração calcular 
o seu valor numérico, o que pode ser muito caro computacionalmente. Além disso a função pode ser não 
diferenciável em alguns pontos do domínio. 


Exercícios 


3.8 - Considere a equação dada no exemplo [5.9 Obtenha a raiz positiva com quatro casas decimais 
corretas. Usando confirme que a ordem de convergência do método de Newton é quadrática, isto é, 
p=2. 


3.9 - Usando o método de Newton, com erro inferior a 102, determinar uma raiz das seguintes 
equações: 


a) 2x=tga, 

b) 527)+212-127+4=0, 
c) sen x— e? =0, 

d) zt—8=0. 


3.10 - Considere a fórmula para determinar a raiz cúbica de Q: 


1 
Tk+1 = 5 [em + s] , k = 0,1,.... 
Tk 


a) Mostre que a fórmula acima é um caso especial de iteração de Newton. 


b) Usando a fórmula dada no item a) calcule 4 com precisão de 1072, determinando o valor 
inicial através de gráfico. 


3.11 - Usando o método de Newton, determine o valor de 7 com 3 algarismos significativos corretos. 
Use como valor inicial xo = 3. 


3.4 Método das Secantes 


Como foi observado anteriormente, uma séria desvantagem do método de Newton é a necessidade de 
se obter f'(x), bem como calcular seu valor numérico, a cada passo. Há várias maneiras de modificar 
o método de Newton a fim de eliminar essa desvantagem. Uma modificação consiste em substituir a 
derivada f'(x) pelo quociente das diferenças: 


Pa = Meto Her), (3.8) 


Tk — Tk-1 


onde £k, &k—1 são duas aproximações quaisquer para a raiz Z. Note que f'(x) é o limite da relação (3.8) 
para Xp 1 > Tk- 
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O método de Newton, quando modificado desta maneira, é conhecido como Método das Secantes. 


Substituindo em obtemos: 


Tk+1 = Tk f (2x) 
j f (£k) — f(zk-1) 
(Tk — Tk—1 


(£k — Tk-1) f (£k) 


O Fa) — SR 


Assim, colocando o segundo membro sobre o mesmo denominador, obtemos uma expressão mais simples 

para o método das secantes: 

E Tk) — É The 

k—1 f (£x) e f (2k-1) (3.9) 
f (£k) — f(zk-1) 


Observe que devem estar disponíveis duas aproximações iniciais, antes que (3.9) possa ser usada. Na 
Figura 3.11, ilustramos graficamente como uma nova aproximação, pode ser obtida de duas anteriores. 


Tk+1 


RIA 


Pa 


f Figura 3.11 


Pela Figura 3.11 vemos que, geometricamente, o método das secantes consiste em considerar, como 
aproximação seguinte, a interseção da corda que une os pontos (£k—1, f(£k—1)) e (£k, f(£k)) com o eixo 


dos x. Tomando: fas) ( ) 
o Tk) (£k — Tk—1 
SENI = Ik — Flak) — fri) 
Tk — Tk no Tk — Tk- 
> Cao) Te- fr) 
anda - MAG - ta 


Exemplo 3.10 - Determinar a raiz positiva da equação: 
vz — be" =0, 


pelo método das secantes, com erro inferior a 1072. 
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Solução: Novamente, para obtermos os valores iniciais xo e zı necessários para iniciar o processo 
iterativo, dividimos a equação original f(x) = 0 em outras duas yı e y2, com yı = yz e yz = 5e7”, que 
colocadas no mesmo gráfico, produz a Figura 3.12: 


34 
2a y2 = 5e” 
14 | 
n=v2 
| 
} } + + > 
1 7 2 3 
Figura 8.12 


O ponto de interseção das duas curvas é a solução g procurada. Analisando a Figura 3.12, vemos que 
x está nas vizinhanças do ponto 1.4. Assim, tomando zo = 1.4 e xı = 1.5, obtemos: 


f(zo) = f(14) = VIÃ-5e 14 =1.183-5 x 0.247 = 0052, 
f(x) = f(15) = V15-5e-15=1.225-5 x 0.223 = 0.110. 


a = 14f(15) — 15 f(14) 
B a E qu 
> Ta = Colo =-(-00) 
= gy = 1.432. 
Calculando o erro relativo: 
Z2 Ti o 0.047 
T2 = i 


observamos que este é maior que 107?. Devemos portanto fazer mais uma iteração. Calculemos então: 


fimo) = f(1.432) = 1,432 — 5671-482 
1.197 — 5 x 0.239 = 0.002. 


Novamente, usando (3.9), obtemos: 


15 f (1.432) — 1.432 f (1.5) 
Po F82 = f5) 
1.5 (0.002) — 1.432 (0.110) 
= ME 0.002 — (0.110) 
> z3 = 1481 
Fazendo: 
Z3 72] « 0.0007 < 1072. 
T3 


Logo, a raiz positiva da equação yx — 5 e7? = 0, com e < 107°, é z = 1.431. 
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Ordem de Convergência 


Daremos aqui a ordem de convergência do método das secantes. 
Teorema 3.7 - 4 ordem de convergência do método das secantes é p = (1+5)/2 = 1.618. 


Prova: A prova deste teorema pode ser encontrada em [Ostrowski,1966]. 


Observe que apesar da ordem de convergência do método das secantes ser inferior à do método de 
Newton, ele fornece uma alternativa viável, desde que requer somente um cálculo da função f por passo, 
enquanto que dois cálculos (f(x) e f'(x)) são necessários para o método de Newton. 


Exercícios 


3.12 - Considere a equação dada no exemplo [3.10 Obtenha a raiz positiva com quatro casas decimais 
corretas. Usando confirme que a ordem de convergência do método das secantes é p ~ 1.618. 
3.13 - Determinar, pelo método das secantes, uma raiz de cada uma das equações: 
a) v=27 Ina, 
b) loga — cos x =0, 


—] 


c) e? — logr=0. 


3.14 - A equação x = tgx tem uma raiz entre E e 37. Determiná-la pelo método das secantes com 
quaç 9 2 € 3 


erro inferior a 1072. 


3.5 Método Regula Falsi 


O método Regula Falsi, é uma variação do método das secantes. Ele consiste em tomar duas 
aproximações iniciais £o e xı tais que f(xo9) e f(x1) tenham sinais opostos, isto é: 


f (zo) x f(x1) < 0. 
Uma nova aproximação é determinada usando o método das secantes, ou seja: 


zo f (zı) — zı f (z0) 
fæ) — f(z) ` 


T2 = 


T2 — To T2 — Tı 
>—— | < € ou|—— E 


T2 T2 


para um € pré-fixado, então x» é a raiz procurada. Caso contrário, calculamos f(x2) e escolhemos entre zo 
e xı aquele cuja f tenha sinal oposto ao da f (x2). Com x» e esse ponto calculamos x3 usando a fórmula 
das secantes, isto é, usando e assim sucessivamente. O processo iterativo deve ser continuado até 
que se obtenha a raiz com a precisão pré-fixada. 


Uma interpretação geométrica do método regula falsi é dada na Figura 3.13. Observe que, na Figura 
3.13, zk+1ı é o ponto de interseção da corda que une os pontos (£k—1, f(£k-1)) e (£k, f(xx)) com o eixo 
dos x. Nesse caso o novo intervalo contendo a raiz será (x -1,%k+1). À aproximação xp,» será o ponto 
de interseção da corda que une os pontos (xk-1, f(xk-1)) e (£k+1, f(£k+1)) com o eixo dos x. Observe 
ainda que a aplicação do método regula falsi sempre mantém a raiz procurada entre as aproximações 
mais recentes. 
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& y 


Figura 3.13 


Exemplo 3.11 - Determinar a menor raiz positiva da equação: 
z — cosz=0, 
pelo método regula falsi, com erro inferior a 1073. 


Solução: Novamente, para obtermos os valores iniciais xo e zı necessários para iniciar o processo 
iterativo, dividimos a equação original f(x) = 0 em yı =£ e y = cos x que colocadas no mesmo 
gráfico, produz a Figura 3.14: 


| 

| 

| 

| 

| 

| 

L 
x 


Figura 3.14 


O ponto de interseção das duas curvas é a solução g% procurada. Analisando a Figura 3.14, vemos que 
x está nas vizinhanças do ponto 0.7. Assim, tomando zo = 0.7 e zı = 0.8, obtemos: 


f(xo) = f(0.7) = 0.7 — cos 0.7 = 0.7 — 0.7648 = —0.0648, 
f (zı) = f(0.8) = 0.8 — cos 0.8 = 0.8 — 0.6967 = 0.1033 , 
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e portanto: f(xo) x f(x1) < 0. Portanto, usando (3.9), obtemos que: 


É = 07 (0.8) — oe an 
o E IHI 0.0648) 
> “2 = 01083 = (00618) 
> & = 0.738. 


Fazendo: 
T2 — To T2 — Tı 


œ~ 0.052 e œ~ 0.084 


T2 


obtemos que ambos são maiores que 1078. Calculando: 


f (z2) f(0.7383) = 0.7383 — cos 0.7383 


0.7383 — 0.7396 = —0.0013. 


vemos que f(x2) x f(xı) < 0, e portanto a raiz está entre xı e z2. Assim, usando novamente (8-9), 
segue que: 
r — 08 f (0.7383) — 0.7383 f (0.8) 
CE f(0.7383) — f(0.8) j 
— 0.8 (—0.0013) — 0.7383 (0.1033) 
—0.0013 — (0.1033) 
> z3 = 0.7390. 


Calculando o erro relativo: 


| 
È 
| 


T3 72| = 0.00095 , 


T3 


vemos que este é menor 1073. Assim, a menor raiz positiva, (observe pela Figura 3.14, que a raiz positiva 
é única) , da equação x — cos x = 0, com e < 1073, é z = 0.7390. 


Ordem de Convergência 


A ordem de convergência do método regula falsi é semelhante ao do método das secantes uma vez que 
o procedimento para o cálculo das aproximações são os mesmos em ambos os casos. Assim a ordem de 
convergência do método regula falsi também é p = (1 + v5)/2 œ 1.618. 


Exercícios 


3.15 - Considere a equação dada no exemplo Obtenha a raiz positiva com cinco casas decimais 
corretas. Usando confirme que a ordem de convergência do método regula falsi é p = 1.618. 


3.16 - Determinar uma raiz de cada uma das equações: 
a) sena — ve” = 0, 
b) cosz = e”, 


usando o método regula falsi. 


3.17 - A equação: x — 2 sen x = 0 possui uma raiz no intervalo [1.8,2.0]. Determiná-la pelo método 
regula falsi, com duas casas decimais corretas. 
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3.6 Sistemas de Equações não Lineares 


Nesta seção consideramos o problema da determinação de raízes de equações não lineares simultâneas 
da forma: 


filzi,ãa,..., Um) =0 
fo(21, £2,..., Em) = 0 
Fm (Tirta pku Bm) =0 
onde cada f;,i = 1,2,...,m é uma função real de m variáveis reais. Embora esse tópico seja de consi- 


derável importância, daremos aqui apenas uma breve introdução. Para maiores detalhes os interessados 
podem consultar, por exemplo, [Ortega, 70]. 

Assim, para efeito de simplicidade, e sem perda de generalidade, consideraremos apenas o caso de 
duas equações a duas incógnitas, isto é, sistemas não lineares da forma: 


zy) a (3.10) 


Geometricamente, as raízes deste sistema são os pontos do plano (x,y), onde as curvas definidas por 
f e g se interceptam. 


3.6.1 Iteração Linear 


A resolução de sistemas não lineares através do método de iteração linear é muito semelhante ao 
método iterativo linear estudado anteriormente. Assim, um primeiro passo ao se aplicar iteração linear é 


reescrever o sistema (3.10) na forma: 
z = Fhe) 
i 3.11 
í y = G(zx,y). (e 
de forma que qualquer solução de (3.11) seja, também, solução de (3.10). 


Sejam (z, 4) uma solução de (3.10) e (£o, Yo) uma aproximação para (z, Y). Obtemos as aproximações 
sucessivas (£k, Yk) para a solução desejada (z, Y), usando o processo iterativo definido por: 


Zum = F(£k,Yk) 
3.12 
i Yk+1 = G(Tk, Yk). em 


Esse processo é chamado Método Iterativo Linear para Sistemas não Lineares. 


O processo (3.12) convergirá sob as seguintes condições suficientes (mas não necessárias): 
a) F, G e suas derivadas parciais de primeira ordem sejam contínuas numa vizinhança V da raiz (z, y). 
b) As seguintes desigualdades sejam satisfeitas: 


|F| + |F| < kı<1 
[Ga] + |G| < k2 <1, 


para todo ponto (x,y) pertencente à uma vizinhança V de (x,y), onde: Fy = T F= So etc. 


c) A aproximação inicial (xo, yo) pertença a vizinhança V de (z, 9). 


Para obtermos uma solução com uma determinada precisão e devemos, durante o processo iterativo, 
calcular o erro relativo para todas as componentes do vetor solução. 
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Exemplo 3.12 - Considere o seguinte sistema não linear: 


f(x,y) = 02272+0227y-240.6=0 
g(x,y) = 047x+0.17yº-y+05=0 
a) Verifique que reescrevendo o sistema dado na forma: 


x = 02724+0227y+0.6 = F(x,y) 
y = 047+0177yº+0.5 = G( 


as condições suficientes para garantir a convergência são satisfeitas. 


b) Aplique o método iterativo linear para resolver o sistema dado. 


Solução: Uma solução desse sistema, facilmente comprovável, é o ponto:(Z, y) = (1,1). É claro que não 
conhecemos, a priori, a solução do sistema , mas este é apenas um exemplo para ilustrar a verificação das 
condições suficientes de convergência , bem como a aplicação do método iterativo linear. Mais adiante 
mostraremos como determinar os valores iniciais. 

Para verificar as condições suficientes, calculemos inicialmente, as derivadas parciais de F e G. Assim: 


F, = 047+02y, F,=0274, 
Gr = 04+019%2, Gy = 0279, 
Se escolhermos, por exemplo, (xo, yo) = (0.9,1.1), vemos que F,G e suas derivadas parciais são 


contínuas em (xo, yo). Além disso, as desigualdades que figuram nas condições para convergência, são 
satisfeitas, pois temos: 


IF| + IF, = |(0.4)(0.9)] + |(0:2)(1.1)] + |(0.2)(0.9)| = 0.76 < 1 
lGel + IG; = 10.4) + (0.0(11)2] + |(0.2(0.9)(1.1)| = 0.719 < 1. 


E é claro que (xo, yo) está na vizinhança de (z, y). Tomando então (zo, yo) = (0.9,1.1) e usando o 
processo iterativo definido por(3.12), obtemos: 


zı = F(xo,y) = (0.2)(0.92 + (0.2)(0.5)(1.1) + 0.6 
> q = 0.96 

yı = G(xoy) = (0.4)(0.9) + (0.1)(0.9)(L.1)2 + 0.5 
> yı = 0.9689 

zə = F(æ,y1) = (0.2)(0.96)2 + (0.2)(0.96)(0.9689) + 0.6 
> z£ = 0.9703 

y2 = G(æı,yı) = (0.4)(0.96) + (0.1)(0.96)(0.0.9689)? + 0.5 
> y2 = 0.9791 

z3 = F(æy2) = (0.2)(0.9703)2 + (0.2)(0.9703)(0.9791) + 0.6 
> z3 = 0.9773 

y3 = G(æ£2,y2) = (0.4)(0.9703) + (0.1)(0.9703)(0.9791)2 + 0.5 
> y3 = 0.9802 


É claro que a sequência (£k, Yk) está convergindo para (1,1). Além disso, podemos dizer que a 


solução (Z,7), com erro relativo inferior a 1072, é (0.9773, 0.9802), desde que lrs —z2) 4 0.007 e 


be œ 0.001. Observe ainda que mesmo se uma das componentes estiver com a precisão desejada, 


mas a outra não, o processo deve ser continuado até que todas estejam com a precisão pré-fixada. 
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Exercícios 
3.18 - Usando o método iterativo linear determinar a solução de: 


x = 07 sen x+0.2 cos y 
y = 0.7 cos x -— 0.2 sen y 


próxima a (0.5,0.5). 


3.19 - O sistema não linear: 


possui uma raiz próxima a (0.8,1.2). Usando o método iterativo linear determine essa raiz com precisão 


de 1071. 
3.6.2 Método de Newton 
Para adaptar o método de Newton a sistemas não lineares, procedemos como se segue: 
Seja (zo, Yo) uma aproximação para a solução (Z,%)) de (3.10). Admitindo que f e g sejam suficiente- 


mente diferenciáveis, expandimos f(x,y) e g(x,y), usando série de Taylor para funções de duas variáveis, 
em torno de (xo, yo). Assim: 


i f(x,y) = f(£o,y0) + fe(x£0, Yo) (£ — xo) + fy(z0,y0) (y — yo) + ... 
g(x,y) = g(xo,yo) + Js (£0, Yo) (x — xo) + gy (z0, y0) (y — yo) + ... 


Admitindo que (zo, yo) esteja suficientemente próximo da solução (Z,) a ponto de poderem ser 
abandonados os termos de mais alta ordem, podemos determinar uma nova aproximação para a raiz 
(z,9) fazendo f(x,y) = g(x,y) = 0. Obtemos, então, o sistema: 


felz- o) + fyly- y) = -f 
{ Ia (e — 20) + Jy yo) = -g (3.13) 


onde está entendido que todas as funções e derivadas parciais em (3.13) devem ser calculadas em (zo, yo). 
Observe que é agora um sistema linear. Além disso, se não tivessemos desprezado os termos de 
mais alta ordem no desenvolvimento de Taylor , então (x,y) seria a solução exata do sistema não linear. 
Entretanto, a resolução de fornecerá uma solução que chamaremos de (x1,y1). Devemos, então, 
esperar que (11,1) esteja mais próxima de (7,4) do que (xo, yo). 

Resolvendo pela regra de Cramer obtemos: 


| me | 
= gra 9 Jy — E + sh 
fo fy | J(f,g) (z0,y0) 
Jx Jy 
fz =f | 
yı — Yo = E = [+ i fo 
Je fy J(f,9) (x0,y0) 
Jx Jy 


onde J(f,9) = fr9y — fygz + 0 em (z0, yo). A função J(f,g) é denominada de Jacobiano das funções 
f eg. A solução (x1, y1) desse sistema fornece, agora, uma nova aproximanção para (Z,y). A repetição 
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desse processo conduz ao Método de Newton para Sistemas não Lineares. 


Assim, o método de Newton para sistemas não lineares é definido por: 


Tk+1 = Tk — Ema 
Yk+1 = Yk — it 
(1,9) (Tk, Yk) 


com J(f,9) = fe9y — fyg- 

Observações: 

1) Quando essa iteração converge, a convergência é quadrática. 

2) O método de Newton converge sob as seguintes condições suficientes: 


a) f,g e suas derivadas parciais até segunda ordem sejam contínuas e limitadas numa vizinhança 
V contendo (z, Y). 


b) O Jacobiano J(f,g) não se anula em V. 
c) A aproximação inicial (£o, yo) seja escolhida suficientemente próxima da raiz (z, 9). 


3) O método de Newton pode ser, obviamente, aplicado a um sistema de n equações a n incógnitas. 
Em cada etapa da iteração teremos, então, que calcular n? funções derivadas parciais e n funções. 
Isso representa um considerável custo computacional. Novamente, a menos que seja disponível uma 
informação, a priori, a respeito da localização da raiz desejada, há, claramente, a possibilidade da 
iteração não convergir ou que ela convirja para uma outra raiz. A solução de um sistema de n 
equações, sendo n um valor elevado, torna-se muito difícil mesmo com o uso de computadores. 


Exemplo 3.13 - Determinar uma raiz do sistema: 


r? +y =2 
gr -y =1 


com precisão de 107°, usando o método de Newton. 


Solução: Temos: f(x,y) = £? +y? —2 = 0 e g(x,y) = x? —y?—1 = 0. Para obter o valor inicial (xo, yo), 
traçamos no mesmo gráfico as duas equações dadas. Para o sistema dado, obtemos a Figura 3.15: 


» 


Figura 3.15 
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Da Figura 3.15, observamos que o sistema dado admite 4 soluções, uma em cada quadrante. Vamos 
aqui determinar apenas a que se encontra no 1º quadrante. O ponto de interseção das duas equações é 
a solução (7,4) procurada. Analisando a Figura 3.15, vemos que (Z,%y) está nas vizinhanças do ponto 
(1.2,0.7). Tomemos então: (xo,y0) = (1.2,0.7). 

Calculamos primeiramente as derivadas parciais: 


fa = 2z, fi = 2y, 
Js = 27, Jy = —29. 
Assim: 
flxoyo) = f(12,07) = (1292 + (072 - 2 = -007, 
g(zo,yo) = g9(1.2,0.7) = (1.2)? — (0.7)? — 1 = —0.05, 
fe(xo, Vo) = fa(1.2,0.7) = 2 x (1.2) = 24 = Jz(£0,; Yo) » 
Je(z0,Y0) = Ga(1.2,0.7) = 2x (0.7) = 1.4 = —gy(z0, yo) 
Então, usando (3.14), obtemos: 
rı = 12- fsi] 
fogy — fyg (1.2,0.7) 


0.07)(=1.4 0.05) (1.4 
ERR 2| = 1.295, 


fxIy — jo] (1.2,0.7) 


| 
| 

ij E de FE 
| 


Calculando o erro relativo: 


yı 


observamos que ambos são maiores que 1078. Assim, devemos fazer nova iteração. Calculemos então: 


fem) = f(1.225,0.7071) = (1.225)? + (0.7071)? — 2 = —0.000615 
gly) = g9(1.225,0.7071) = (1.225)2 — (0.7071)? — 1 = —0.000635 . 
fela,y) = fe(1.225,0.7071) = 2x (1.225) = 245 = galaxy), 
Gx(21,y1) = 9=(1.225,0.7071) = 2x (0.7071) = 1.4142 = -g,(21,y) 
Novamente, usando (3.14), segue que: 
2 = L225- | fash] 
z9y — fyg (1.225,0.7071) 


—0.000615)(—1.4142) — (—0.000635) (1.4142 
= o Í Do TE T) | = 


y = orori — | fla Sos 
Joy = Fuge | (4,225,0.7071) 


—0.000635) (2.45) — (—0.000615) (2.45 
= Sum $ EET + ESTE) | mi 
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Calculando o erro relativo: 


Y2 — yı 


Ya 


to — Ti 


œ 0.0002 e œ 0.0001 


T2 


vemos que estes são menores que 1073. Assim, a solução do sistema dado é (z, 9) = (1.2252, 0.7070) com 
e< 1078. 


Exercícios: 


3.20 - Usando o método de Newton determine, com precisão de 107°, uma raiz para cada um dos 
seguintes sistemas não lineares: 


z? + xy? = 9 com (xo,y) = (2;2.5). 


2497 -1=0 
ii) p A 1 
q + y 5 = 0 com (xo,y0) = (1;3). 


iii) i o eo Sa 
x? + (y—1)? = 4 com (xo,y) = (2;1). 


3.7 Equações Polinomiais 


Embora as equações polinomiais possam ser resolvidas por qualquer dos métodos iterativos discuti- 
dos previamente, elas surgem tão frequentemente que recebem um tratamento especial. Em particular, 
apresentaremos alguns algoritmos eficientes para a determinação de raízes isoladas de polinômios, sejam 
elas reais ou complexas. 

Seja 


Pl = anI” Ga + + arg tao 
| (3.15) 
= = ei iX’, An a 0. 


um polinômio de grau n com a, * 0. Então, os seguintes resultados são válidos para P(x): 
a) P(x) possui, pelo menos, uma raiz. 
b) P(x) possui, exatamente, n raízes, desde que uma raiz de multiplicidade k seja considerada k vezes. 


c) Se os valores numéricos de dois polinômios de grau < n coincidem para mais do que n valores 
distintos de x, os polinômios são idênticos. 


d) Se w1,x2,...,tn forem as raízes de P(x), então P(x) pode ser expresso univocamente na forma 
fatorada: 


P(x) = an(z£ — z1)(£ — £2) ... (x — Tn). 


e) Se os coeficientes ap, (k = 0,1,...,n) forem reais, e se a + bi for uma raiz complexa de P(x), então 
a — bi será também uma raiz de P(x). 
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3.7.1 Determinação de Raízes Reais 


Inicialmente deduziremos um algoritmo para a determinação das raízes reais de polinômios. Conside- 
raremos apenas polinômios contendo coeficientes reais. Em qualquer método iterativo para determinação 
de uma raiz de um polinômio, teremos que calcular, frequentemente, o valor numérico do polinômio para 
um determinado número real. Portanto, é importante realizar esse cálculo de uma forma tão precisa 
quanto possível. Por exemplo, usando o método de Newton, temos: 


x x P (mr) 
kti = Ck = SNS 
e Pp! (£k) 
Para medir a eficiência dos algoritmos para calcular o valor do polinômio num ponto, usemos a seguinte 
notação: 


e u = tempo de processamento de uma multiplicação, 
e a = tempo de processamento de uma adição, 


Se P(x) é calculado pela fórmula (8.15), então devemos calcular as potências de x fazendo x" = 
x x £771, os quais requerem (n — 1)u; termos da forma apa"-*, os quais requerem np; e a soma dos 
termos, os quais requerem na. Assim, nessa maneira de cálculo, o total é (2n — 1)u + na. Além disso, 
quase a mesma quantidade é requerida se P'(x) é calculado por esse método. 

Em vista da simplicidade do problema, é surpreendente que exista um algoritmo que calcula P(x), P' (x) 
e também as derivadas de ordem superior de P(x), caso se deseje, com uma quantidade muito inferior de 
tempo de processamento. Esse algoritmo, chamado de Algoritmo de Briot- Ruffini-Horner, é obtido 
escrevendo a fórmula para P(x) da seguinte maneira: ( Vamos considerar n = 4, para simplicidade.) 


Plz) = aszt + azz? + azz? + aiz + ao 
= (((a4£ + az)z + az) + ai)z + ao. 


Desse modo temos que o tempo de processamento requerido é: 4u + 4a. Assim, de um modo geral, 


para um polinômio de grau n podemos formular o algoritmo da seguinte maneira: Dados an, @n—1;-- -, 40, 
calcular bp, bn—1,-- -, bo, de acordo com: 
bn =an, bn-k = Unit, k=1,2,...,n. (3.16) 


Portanto, bo = P(x) = valor de P em x. Assim, z é uma raiz de P(x) se e somente se, no algo- 
ritmo de Briot-Riffini-Horner, formado com o número 7, resultar que bo = 0. Observe que o tempo de 
processamento requerido agora é: nu + na. 

Vamos aplicar agora a bą o mesmo algoritmo que aplicamos a ap. Fazendo isso, obtemos números cy. 
de acordo com: 

Cn =bn, Cn-k = ZCn-k+1 + bn-k, k=1,2,....0,n—1. (3.17) 


Para nossa surpresa, cı = P'(x), e assim o valor da derivada do polinômio em «x é obtida, com tempo 
de processamento igual a (n— 1)(u+a). A prova analítica de que cı = P'(x), é feita por diferenciação da 
relação de recorrência dada por (3.16), lembrando que by é função de x enquanto que os ay não. Assim, 


derivando (3.16), obtemos: 
bn =0, rd rare B=1A ego 


Vemos que bl. 4 = bn, e que as quantidades c = bj, são idênticas aos cy; definidos por (3.17). 
Portanto desde que bo = P(x), segue que: cı = by = P'(a). 
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Seja x = z, então os valores de P(z), fórmulas (3.16), e P'(z), fórmulas (3.17), podem ser obtidos 
através do esquema prático: 


Seja P(x) = an £” + an-ı £” +...+ ax + ap. Então: 
J 


An Gn—1 Un—2 ... a2 a ao 
l + + + 
Z Zbn  Zbn-1 zh zb% zbi 
ba bna bna De ba OL Do 
I + + 
Zz ZCn Zn- -=< 203 209 
Cn Cn-1 Cn-2 ... C2 C1 


com bo = P(z) e c = P'(z). 


Note que o esquema prático acima quando utilizado para calcular apenas o valor do polinômio num 
ponto é o conhecido algoritmo de Briot-Ruffini. O esquema de Briot-Ruffini-Horner, na verdade, fornece 


A ZA AA 
o valor de P (2) e pode ser continuado para obtenção de E (2). P (2) etc. (ver |Henrice, 1977]). 
I! 2! 3! 


Assim, quando f(x) é um polinômio, o método de Newton, fórmula (8.9), pode ser expresso como: 


bol(xk) 
Ci (xx) , 


Tk+1 Z Tk — (3.18) 


onde bolz) e cı(£k) representam, respectivamente, o valor do polinômio e da derivada do polinômio 
avaliados em z£ķ. 


Vamos assumir agora que z é um zero de P(x). Se P(z) = 0 então bo = 0. Afirmamos então que: 

Os números bn,bn-1,...,b1 são os coeficientes do polinômio Q(x), obtido da divisão de P(x) pelo 
fator linear x — z, isto é: 
P(x) 


Q(x) = bn gi + bn-1 qr? +... + bi = 


De fato, 
(bn £” + bni 2°? + ... + bl(x—z) 
= bpn Z” + (bn-1 = 2 bn) e1 F.. 
T (bi — z bo) x£ + (bo — z by) 
= nT” +an-1X"T! +... + az +a = P(T). 
onde usamos a fórmula de recorrência dada por (3.16), com x substituido por z. 
Assim, se z é uma raiz de P(x), podemos escrever que: 


P(x) = (x— )Q(x), 


e portanto concluímos que qualquer raiz de Q(x) é, também, uma raiz de P(x). Isto nos permite operar 
com um polinômio de grau n — 1, ou seja, com Q(x), para calcular as raízes subsequentes de P(x). Esse 
processo recebe o nome de Deflação. Usando esse processo evitamos que um mesmo zero seja calculado 
várias vezes. 


Exemplo 3.14 - Determinar todas as raízes de: 


P(x) = £? +27 -— 0.85 27-17, 


com precisão de 102, usando o método de Newton, para o cálculo da primeira raiz positiva. 
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Solução: Seja yı = £? e y2 = — 2 £? + 0.85 x + 1.7. Plotando ambas as curvas no mesmo gráfico, 
obtemos: 
24 
yı 
1-4 
Ny 
! + 
T1 2 
Figura 3.16 
Vemos então que 7, está nas vizinhanças de 0.9. Assim, seja xo = 0.9. Calculemos inicialmente 


P(0.9) e P'(0.9), usando o algoritmo de Briot-Ruffini-Horner. Portanto: 


1 2 —0.85 —1.7 
0.9 0.9 2.61 1.584 
1 2.9 1.76 —(0.1164 
0.9 0.9 3.42 
1 38 5.18 
Portanto, usando (3.18), segue que: 
bo(0.9) -0.1164 
= 0.9 — > = 0.9 — ——— > = 0.9224. 
“i a09) 7 5.18 i 
Calculando o erro relativo, 
OO o 002, 
Tı 


vemos que o mesmo é maior que 107?. Assim devemos fazer nova iteração. 


1 2 —0.85 —1.7 
0.9224 0.9224 2.6956 1.7024 
1 2.9224 1.8456 0.0024 
0.9224 0.9224 3.5464 
1 3.8448 5.392 
Logo: 
bo(0.9224) 0.0024 
= 0.9224 — ——— > = 0.9224 — —— > = 0.9220. 
o c1(0.9224) ” “2 5.392 * “2 
Calculando o erro relativo: 
72 71| © 0.0004, 
T2 


vemos que este é menor que 107?, e assim Z7 = 0.9220 é uma raiz de P(x) com a precisão exigida. As duas 
raízes restantes podem ser obtidas, agora, a partir do polinômio do segundo grau: Q(x) = bax? +b2x +b1. 
Aplicando novamente o algoritmo de Briot-Ruffini-Horner, obtemos: 
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1 2 —0.85  —17 
0.9220 0.9220 2.6941 1.7002 
1 2.9220 1.8441 0.0002 


e assim podemos escrever que: 
Q(x) = xz? + 2.9220 x + 1.8441. 
Usando a fórmula que nos fornece as raízes de uma equação do segundo grau, obtemos que as outras 
duas raízes de P(x) são: z = —0.9235 e z = —1.9985. 
Exercícios 


3.21 - Calcular P(5) e P'(5) para o polinômio: P(x) = 7º — 3x4 + 2x? — 3x + 5. 


3.22 - Determinar todas as raízes do polinômio: P(x) = x? — 5x? — x +5 = 0, com precisão de 107?, 
usando o método de Newton e o algoritmo de Briot-Ruffini-Horner para o cálculo da primeira raiz. 


3.23 - Use o método das secantes e o algoritmo de Briot-Ruffini para determinar a única raiz negativa 
da equação f(x) = z? — 2x? — x +2 = 0, com precisão de 1072. 


3.24 - A equação f(x) = x? — 0.5 = O possui uma raiz entre 0.5 e 1.0. usando o método Regula Falsi 
e o algoritmo de Briot-Ruffini determinar essa raiz com precisão de 1072. 


3.7.2 Determinação de Raízes Complexas 


O método de Newton pode ser usado também para calcular as raízes complexas de polinômios. Neste 
caso entretanto devemos usar aritmética complexa. Veremos aqui como determinar as raízes complexas 
de um polinômio usando aritmética real. 

Se P(x) é um polinômio da forma com coeficientes reais, as raízes complexas ocorrem, então, em 
pares conjugados, e, correspondendo a cada par de raízes complexas conjugadas, há um fator quadrático 
de P(x) da forma: 

rL og = By 
onde a e 8 são números reais. Consideremos, primeiramente, a divisão de um polinômio P(x) de grau 
n > 2 por um fator quadrático. É claro que, em geral, podemos expressar P(x) na forma: 


P(x) = (x? car — p) Q(x) + bi(x—a) + bo, (3.19) 
onde Q(x) é um polinômio de grau n — 2, que representamos na forma: 
Q(x) = bra”? + ba a + +b, (3.20) 


e bı(x — a) + bo é o resto. 
É conhecido da teoria dos polinômios que x? — a x — 8 será um divisor exato de P(x) se e somente 
se, b1 = bo = 0. Quando bı = bo = 0, a expressão (3.19) torna-se: 


P(x) = (x? — az — b) Q(z). 


Portanto as raízes de z? — a x — Be as raízes de Q(x), serão, também, raízes de P(x). Nosso objetivo 
é então obter coeficientes a e 8, de tal forma que x? — ax — 8 seja um divisor exato de P(x), pois teremos 
duas raízes a partir do fator quadrático e as demais poderemos obter através do polinômio Q(x). Para 
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determinarmos os coeficientes bk, k = 0,1,...,n em (3.19) para valores arbitrários de a e 5, expandimos 
o lado direito da igualdade (3.19). Assim: 
P(x) = x? (bn q" 2 + bad to ++ bo) 
— ax (bn qr bas q É dus b2) 
e B (bn gr? ig bn-1 g3 e. bo) 


= bra” + (bn-1— a bn)! + (bn-2— @ bn-1 — B bn) s"? 
+ (bı a bo B ba)x + (bo— a bı — 8 bo). 


Igualando esses coeficientes aos de P(x) em (3.15) e reagrupando os termos, obtemos as fórmulas de 
recorrência: 


(3.21) 


bi = a a bz p ba, 


Os números bn, bn-1,.-.,b> são os coeficientes do polinômio Q(x). 


Esquema Prático para o cálculo de bķ, k = 0,1,... 


Seja P(x) = anx” + anti +... + aix + ap. Então: 


An Gn—-1 An—2 wie à a2 a ao 

+ + + + + 

Q If ab, aba Tr abs aba abı 
+ + + + 

BI l Bbn ... Bba Bbs pbz 
bn bn—1 bn—2 Ker bo bı bo 


Em bı e bo são, logicamente, funções de a e 3. Em geral, para uma escolha arbitrária de a e 

8, eles não se anularão. Encontrar o fator quadrático que seja divisor exato de P(x) equivale a resolver 
o sistema de equações não lineares: 

i by (a, B) 0 

bo (a, 8) = 0 


Se (ao, 8o) forem aproximações das raízes (à, B) de (3.22), podemos tentar resolver esse sistema pelo 
método de Newton para funções de duas variáveis. A correção (ao) de (ao, Bo) onde: 


ao = q — ao e ôbo= fı- bo, 
pode ser encontrada solucionando-se o sistema: 


o dao + 5 bo = —bı (ao, Bo) 


(3.22) 


(3.23) 


bo Sag + 2 Sa = —bo (an, Ao) 


onde as derivadas parciais devem ser calculadas em (ao, 80). Uma vez que não podemos expressar bı e 
bo, explicitamente, como funções de a e 8, não podemos calcular explicitamente as derivadas. Bairstow 
propôs um método simples para calcular numericamente estas derivadas parciais. 
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Para obter Ob e So derivamos (3.21) em relação a a, tendo em mente que os ag são constantes e 
que os by são todos funções de a, exceto bn. Portanto: 


a Obn-1 


= bni + adro 


ðbn—ə | ÔObn-1 3.24 
= bn—2 Q ða j p ða , ( ) 


Ob , Ob 
ga Md qm é 


São = bi | ag | pb 


T T a . 


Fazendo ck 41 = Sor, k=n-1,n-2,...,1,0, temos que (3.24) pode ser expresso da seguinte maneira: 


Cn == bn, 

Choi = Basto F OC; 

Cn-2 = bn-2 T QAln-1 T Ben , 

Cn-3 = bn-3 + QCn-2 + bcn- , (3.25) 
C2 = bo + acz + Be, 

Cı = bi (0465) Becg š 


Comparando (3.25) com (3.21) vemos que os cy são obtidos a partir dos by, da mesma forma como os 
by foram obtidos a partir dos ap (exceto que não existe o termo co). Além disso, as derivadas requeridas 


pai ob ob 
O FG, l >e. (3.26) 
da 


da 
Para obter a. om, derivamos (3.21) em relação a 6, tendo em mente que os ay são constantes e 
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que os by são todos funções de 8, exceto bn e ba-1. Portanto: 


o — 08 7L. 
Obn-a = 
g = bn , 
Obn-3 b 1 Oba-s 
aero T hds a a 
Obn-4 b qobn-3 | bn- (3.27) 
ƏB — n-2 aB T ƏB , 
bo _ bı Obs 


Fazendo di;,2 = bh, i = n — 2,n — 3,...,1,0, temos que (3.27) pode ser escrito como: 
da = bn, 
dn-1 = bn—1 EJ adn , 
dn-2 = bn-2 ga adn—ı T bdn , 
Cn-3 = bn-3 + ada-2 + Bda, (3.28) 


da = by + ad, + pds, 
ds = bs ada bds . 


Comparando (3.28) com (3.25) vemos que dy = ck, k=2,3,...,n. Portanto: 


e — de, Ti — da. (3.29) 
Assim, usando e (3.30), as equações empregadas para a determinação das correções 
dao, 300, tornam-se: 
c2 ao + c3 080 = — bı (ao, o) 
(3.30) 
cı ao + c2 080 = — bo (ao, o) 


Esse método para a determinação de um fator quadrático de um polinômio e as correspondentes raízes 
é chamado Método de Newton-Bairstow. 

O método de Newton-Bairstow se constitui num poderoso e eficiente algoritmo para o cálculo das 
raízes complexas de polinômios. Poderoso porque converge quadraticamente e eficiente porque fornece 
um algoritmo simples para a obtenção das derivadas parciais requeridas. Sua maior deficiência é que 
muitas vezes é difícil selecionar adequadamente as aproximações iniciais (œo, 8o) a fim de garantir a 
convergência. Entretanto, podemos obter (œo, 6o), usando o algoritmo Q-D, (ver próxima seção). Observe 
que o método de Newton-Bairstow pode ser utilizado para obter as raízes reais (desde que uma raiz real 
pode ser considerada uma raiz complexa cuja parte imaginária é zero) de polinômios com a vantagem de 
se conseguir duas raízes de cada vez. 
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Exemplo 3.15 - Calcular todas as raízes da equação polinomial: 
P(x) = 2! — 2r + 4g? -47+4=0 
pelo método de Newton-Bairstow, iniciando com (ag, Bo) = (1, —1). 


Solução: Primeiramente calculamos os bp e os Ck. Assim: 


1 2 -4 4 
1 1 -1 2 -1 
-1 -1 1 -2 

1 -1 -1 1 
1 1 
-1 -1 0 

1 0 0 


Resolvemos, então o sistema: 


i 1. dao + 0. 580 =1 


0. dao E 1.580 = — 
cuja solução é: dao = 1 e db) = —1. 
Assim: 
q = Qo + da > a = 2, 
bı = bo + bo => bı = -—2. 
Repetimos, então, o processo com (01,1) = (2, —2). Logo: 


2 2 0 4 0 
-2 -2 0 -4 


Obtemos então bı = bọ = 0. Logo, x22-a x— 8 = «2-2 x+2 é um divisor exato de P(x). Portanto 
as raízes de x? — 2x + 2 são também raízes de P(x). Mas, 


P(x) = (1º —2£ +2) Q(a), 


onde: 
Q(z) =° +2. 


Assim, as raízes de Q(x) são também raízes de P(x). 
Tai 


+ V2 t. 


Logo as raízes de P(x) são: 


Exercícios 
3.25 - Dividir o polinômio zê — 3x5 + 4x? — 5 por x? — 3x + 1, e ercrevê-lo na forma B1). 


3.26 - Usar o método de Newton-Bairstow para determinar as raízes de P(x) = x? — 6x? + 9x — 4, 


partindo da divisão de P(x) por x? — z. 
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3.7.3 Algoritmo Quociente-Diferença 


Os métodos de Newton e Newton-Bairstow para determinação de zeros de polinômios são eficientes 
se conhecemos, respectivamente, uma aproximação inicial suficientemente próxima da raiz, ou uma apro- 
ximacão inicial adequada para o fator quadrático. 


Nessa seção apresentaremos um método numérico que determina os zeros de um polinômio sem conhe- 
cer aproximações iniciais, mesmo que as raízes sejam complexas. Tal método, conhecido como Algoritmo 
Quociente-Diferença, ou simplesmente Algoritmo Q-D, é um esquema devido a Rutishauser, que for- 
nece simultaneamente aproximações para todos os zeros de um polinômio, sejam eles reais ou complexos. 
Maiores detalhes sobre o algoritmo Q-D, podem ser encontrados em [Henrici, 1964] ou em [Albrecht, 1973]. 


Seja P(x) um polinômio da forma (3.15), isto é: 
P(x) = anz” +an-18"! +... +a. 


Vamos considerar que P(x) é um polinômio de grau n > 1, com ap £0,k=0,1,...,n. 


A partir de P(x) construímos linhas de termos q e e, começando a tabela calculando a primeira linha 
de q's e a segunda linha de e's, da seguinte maneira: 


aĝ? = Ra ae qo? = 0, = 2 ari 
ün 
An— n 
eP = cima bat k=1,2,...,n-1; eP = el) 0 
An—k 
Assim as duas primeiras linhas da tabela são: 
e q) eD q) e ql. emD gm em 
ûn—1 
-i 0 0 0 
An—2 An—3 a 
0 MT o pei ai 0 
As novas linhas de q's serão calculadas através da equação: 
novo q = MDA K=1,2,..5,n, (3.31) 


usando os termos das linhas e e q acima. Note que nessa equação o novo q é igual ao e à direita menos 
e à esquerda mais q acima. As novas linhas de e's são calculadas pela equação: 
k+1 
=— e 
qt) 


onde o novo e é igual ao q à direita sobre q à esquerda vezes e acima. 


novo ef) = VW k=1,2,... n, e® =e =0, (3.32) 


Utilizamos sucessivamente as fórmulas e até que os e's tendam a zero. Quando isso 
ocorrer, os valores de q aproximam os valores das raízes, se estas forem reais. Se o polinômio tiver um 
par de raízes complexas conjugadas, um dos e's não tenderá a zero mas flutuará em torno de um valor. 
Nesse caso devemos montar um fator quadrático da forma: x? — rx — s, do seguinte modo: a soma dos 
dois valores de q, um de cada lado do valor de e em questão, aproximará o valor de r e o produto do 
valor de q acima e à esquerda vezes o valor de q abaixo e à direita aproximará o valor de —s. Fazendo 
x? — rz — s = 0, determinamos as raízes complexas. Caso semelhante vale para raízes de multiplicidade 
2. Daremos a seguir exemplo. 
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Exemplo 3.16 - Usando o algoritmo Q-D obter todas as raízes do polinômio: 
P(x) = xf — 6z? + 127º — 19x +12. 


Solução: Aplicando o algoritmo Q-D, obtemos a tabela a seguir, onde após calcularmos as duas primeiras 
linhas indicamos com setas como calcular os novos q's e e's: 


e0) qD eD q? Re) q? e q® e) 
+ v 6.000 +0 0 0 

0 | -2000-( 1583 —0.632 0 
4.000 “4 / 0.417 4 / 0.951 0.632 

0 —0.208 —3.610 — 0.420 0 
3.792 —2.985 4.141 1.052 

0 0.164 5.008 —0.107 0 
3.956 1.859 —0.974 1.159 

0 0.077 —2.624 0.127 0 
4.033 —0.842 1.777 1.032 

0 —0.016 5.538 0.074 0 
4.017 4.712 —3.687 0.958 

0 —0.019 —4.333 —0.019 0 
3.998 0.398 0.627 0.977 

0 — 0.002 —6.826 — 0.030 0 
4.000 —6.426 7.423 1.007 

0 0.003 7.885 —0.004 0 
4.003 1.456 — 0.466 1.010 


Observe que na tabela acima q!) está convergindo para 4 e q!” está convergindo para 1. Assim 4.004 
e 1.010 são aproximações para duas das raízes de P(x). Agora, desde que e(2) não está convergindo para 
zero, q? e qt), representam o fator quadrático: «2 — rx — s, onde: 


r = 1.456+(-0.466) = 0.990, 
s = (-6.426)x (—0.466) = 2.995. 


Portanto igualando o fator quadrático a zero, isto é, fazendo: 
x? — rg — s = r? — 0.990x + 2.995 = 0, 
obtemos que: 0.495 + 1.6568i são aproximações para as outras duas raízes de P(x). Podemos então 
escrever que: 


P(x) = (x — 4.004)(x — 1.010) (a — (0.495 + 1.6568)) (a — (0.495 — 1.65681)) . 


É claro, como já dissemos, que os valores encontrados são aproximações para as raízes de P(x). Se 
desejarmos o resultado com mais casas decimais corretas, podemos aplicar o Algoritmo Q-D versão 
Newton: aplica-se o algoritmo Q-D para obter aproximações para as raízes, e usando o método de New- 
ton ou Newton-Bairstow refina-se a solução até obtê-la com a precisão desejada. Esta versão de Newton 
faz com que o algoritmo seja praticamente livre de erros de arredondamento. 


Observações: O algoritmo Q-D não se aplica se: 
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a) durante o processo ocorrer algum q = 0, (divisão por zero). 
b) o polinômio dado tiver raízes nulas, ( é exigido que todos os coeficientes sejam diferentes de zero). 


c) se existir algum coeficiente igual a zero. 


Para entender a observação do item a) resolva o primeiro exercício proposto a seguir. Em relação 
ao item b) o processo pode ser aplicado desde que elimenemos do polinômio as raízes nulas antes de 
aplicá-lo. Em relação ao item c), isto é, se existir algum coeficiente igual a zero basta fazer uma mudança 
de variável: z = x — a, onde a é uma constante real arbitrária. Com a mudança de variável obtemos um 
polinômio que possui todos os coeficientes diferentes de zero. Aplicamos a esse polinômio o algoritmo 
Q-D. Determinadas as raízes usamos a mudança de variável para obter os zeros do polinômio dado, isto 
é vx=z+a. Assim: 


Exemplo 3.17 - Dado P(x) = 81x! — 108xº + 24x + 20, determinar um polinômio que possua todos os 
coeficientes diferentes de zero. 


Solução: Temos em P(x) que o coeficiente az = 0. Fazemos então a mudança de variável: z = x — a. 
Com essa mudança de variável obteremos um polinômio P*(z). Observe que tal polinômio é facilmente 
obtido se desenvolvermos P(x) em série de Taylor em torno do ponto a. De fato, para o polinômio dado, 
obtemos que: 


Pha) = P(a)+(2-a)P(a) + E pra) 
+ (a m P"'( )+ (x = P) (a) 
Fazendo x — a = z, obtemos: 
P* (2) = P(a) + zP'(a) + 2 Pla) + 3 Pla) + PÉ (a) i 


2! 3! 4! 


Os coeficientes do polinômio P*(z) são obtidos aplicando-se o algoritmo de Briot-Ruffini-Horner, (ver 
seção 3.7.1). Como o valor de a é arbitrário, em geral, consideramos a = 1 > z = g-— 1. Portanto, 
para o polinômio dado, devemos calcular o valor do polinômio P(x) e de suas derivadas no ponto a = 1. 
Assim: 


81 —108 0 24 20 
1 81 —27 -27 0 —3 
81 27 -27 -3 17 
1 81 54 27 
81 54 27 24 
1 81 135 
81 135 162 
1 81 
81 216 
1 |81 


Logo: 
P*(z) = 817º + 2162 + 1627 +24z +17. 


Usamos a algoritmo Q-D para calcular as raízes de P*(z) e a seguir fazendo « = z + 1, obtemos as 
raízes de P(x). 
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Exercícios 


3.27 - Verifique que não é possível determinar as raízes de P(x) = x? — 2x + 2, usando o algoritmo 


Q-D. 
3.28 - Usando o algoritmo Q-D determinar todas as raízes de: 
a) P(x) = 812º — 10873 + 24x + 20, 
b) P(x) = 1281! — 256x + 16072 — 32x + 1. 


com duas casas decimais corretas. 


3.8 Exercícios Complementares 


3.29 - Mostre que as seguintes equações possuem exatamente uma raiz e que em cada caso a raiz está 
no intervalo [0.5, 1]. 


a) xz?+ln 2=0, 
b) zxe?-1=0. 
Determine essas raízes, com duas casas decimais corretas, usando o método da bissecção. 


3.30 -Aplique o método da bisseção e Regula Falsi para calcular a raiz positiva de x? — 7 = 0 com 
e < 102, partindo do intervalo inicial [2.0,3.0]. 


3.31 -Aplique o método da bissecção para resolver: 
a) e -v-31=0, 
b) a“ +cos x =0, 
obtendo em cada caso a e b (iniciais) graficamente. 


3.32 - O problema: resolva f(x)=x+ln x=0 pode ser transformado num problema equivalente da 
forma x = y(x). Para o processo iterativo definido por zk}ı = W(x); analisar a convergência quando: 


OOR 
b) (x) = e7, 
no intervalo [0.5,0.6] . 


3.33 - A equação x? +5x— 1 = 0 tem uma raiz em (0,0.5). Verifique quais dos processos abaixo podem 
ser usados, com sucesso, para obtê-la: 


1— r? 
a) Zu = -F 
b) Tk+1 = 1 -Š Tk , 
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3.34 - A equação f(x) = e” —3 x? = 0 tem três raízes. Um método iterativo pode ser definido usando 
a preparação óbvia da equação: 
er 


3 


t= 


i) Verificar que começando com zo = O haverá convergência para a raiz próxima de —0.5, se o valor 


negativo for usado e que haverá convergência para a raiz próxima de 1.0, se o valor positivo for 
usado. 


ii) Mostrar que a forma acima não converge para a terceira raiz próxima de 4.0, qualquer que seja a 
aproximação inicial próxima da raiz. 


3.35 - 4 fórmula vn = 2 £n — a x2 é candidata para se determinar o inverso de um número a; r 


Mostre que se a fórmula converge, então converge para 1 e determine os limites da estimativa inicial £o 
para convergir. Teste suas conclusões nos casos: 


a) a=9 e x =01. 
b) a=9 e x) =1.0. 


3.36 - Mostre que x? — 2x — 17 = 0 tem apenas uma raiz real e determine seu valor correto até 2 casas 
decimais usando o método de Newton. 


3.37 - A equação x? — 2x — 1 = 0 possui apenas uma raiz positiva. 


a) De acordo com o princípio da bissecção, esta raiz positiva deve estar em qual dos intervalos: 


(0,1),(1,2),(2,3)? Por que? 


b) Se desejássemos também pesquisar as raízes negativas usando intervalos de amplitude a até o ponto 
—2, em que intervalos seriam encontradas tais raízes? 


c) Obtenha a menor raiz negativa (em módulo), usando o método das Secantes. Trabalhe com arredon- 
damento para 3 casas decimais. 


3.38 - Usando o método de Newton determine t (real), com erro relativo inferior a 1072, tal que a 
matriz: 


0.5 02 t 
A = 0.4 t 05 
t 05 0.2 


seja singular. 


3.39 - Usando o método de Newton determine, sem efetuar a divisão, o valor numérico de £ = E com 
3 casas decimais corretas, iniciando com xo = 0.3. 


3.40 - A solução da equação diferencial: 


d"u(t) E: dtu(t) | i du(t) 0 
dt” SRS a, A E o T 


An 


x 
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onde os Ay são as raízes distintas do polinômio: 


P(A) = an À” + ani AI + doa Ad a, 


chamado polinômio característico da equação diferencial e os qk são polinômios de grau uma unidade 
inferior à multiplicidade de Akg, mas a não ser por isso, arbitrários. 
Deseja-se determinar a solução geral da equação diferencial: 


dêu(t) o Put) l g ZO 
dt3 dt? dt 


t Tult) = 0. 


Determine a única raiz negativa do polinômio característico pelo método de Newton e o algoritmo de 
Briot-Ruffini-Horner, com erro inferior a 107°, e as demais raízes através da equação do 2º grau. 


3.41 - Seja T uma raiz da equação f(x) = 0. Supomos que f(x), f'(x) e f(x) sejam contínuas e 
limitadas num intervalo fechado I contendo xz = z e que f'(z)=0 e f(x) #0. (Observe que nestas 
condições 7 é um zero de multiplicidade 2 de f(x) = 0). 


a) Mostre que o método iterativo definido por: 


Tk4+1 = Tk — 2 


converge para a raiz X se xp E I. 


b) O método definido em a) estende-se para uma raiz de multiplicidade m da seguinte maneira: 


Fax) 
x = t- mMm n k=0,1,2,... 
k+1 k Fa 


Calcular a raiz z próxima de 1, da equação: 
fla) = xt — 3.1 r? +2.52 x° + 0.432 x — 0.864 = 0, 


com erro relativo inferior a 102, usando o método descrito acima e sabendo que f(x) = f'(x) = 
P (z)=0 e fz) #0. 
3.42 -Dado o sistema não linear: 
r3’ —3 xy +1=0 
3r? y- y3 =0 
Determine uma solução com 2 dígitos significativos corretos, iniciando com (zo, yo) = (0.51, 0.85), e 
usando: 
a) método iterativo linear 
b) método de Newton. 


3.43 - Mostre que o sistema não linear: 


3z? +y? +9z-y-—12=0 
x? +36 y? — 36 = 0 


possui exatamente 4 raízes. Determine essas raízes usando o método de Newton, com 2 dígitos significa- 
tivos corretos, iniciando com (1,1), (1, —1), (—4,1) e (—4, —1). 
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3.44 - Sejam C = (1,0) e D = (0,1). Usando o método de Newton para sistemas não lineares determine 
o valor de um ponto P = (x,y), com precisão de 1072, que diste 2 unidades de C e de D, obtendo os 
valores iniciais necessários através de gráfico. 


3.45 - Considere o seguinte problema: “dado um polinômio de grau n com coeficientes reais, P(z), 
onde z é uma variável complexa, determinar uma raiz complexa de P(z), se existir, ou seja resolver a 
equação P(z) = 0”. Como z = x + i y, o polinômio P(z) pode ser escrito na forma: 


P(z) = u(x,y) +i v(x,y) 


Então resolver a equação P(z) = 0 é equivalente a resolver o seguinte sistemas de equações: 


Dada uma aproximação inicial (zo, yo) conveniente, podemos resolver este sistema pela extensão do 
método de Newton (para sistemas não lineares). 

Aplique o processo descrito acima para determinar uma aproximação da raiz complexa de P(z) = 
z? —2 2+3, tomando como valor inicial (xo, yo) = (1,1). 


3.46 - Dado que: x? — 3.9 x + 4.8 é um fator aproximado de x! - 4 z? 4+472+47-5=0,useo 
método de Newton-Bairstow para melhorar a aproximação. 


3.47 - Considere a matriz: 


1-2 00 
2 800 
e aro OVA 
0 02 + 


Sabendo que o determinante de A é o polinômio P(t) = 2 t!-32, determine todos os valores de t, com 
erro inferior a 107°, que tornem a matriz singular. Utilize o método de Newton-Bairstow e use como 
fator quadrático inicial x? — 0.0001 x — 3.999. Trabalhe com arredondamento para 4 casas decimais. 


3.48 - Usando o algoritmo Q-D versão Newton (para a raiz real) e Newton-Bairstow (para as raízes 
complexas), determine todos os zeros de P(x) = x? — x? + 2x — 2, com 4 casas decimais corretas. 


3.9 Problemas Aplicados e Projetos 
3.1 - A equação de Kepler, usada para determinar órbitas de satélites é dada por: 
M = z — E senz. 
Dado que E = 0.2 e M = 0.5, obtenha a raiz da equação de Kepler. 


3.2 - Em problemas de fluxo em tubulações, é frequente precisar resolver a equação: cs D5 +cı D+co = 
0. Se cs = 1000, cı = —3 e co = 9.04, determine uma primeira raiz usando o método de Newton e então 
aplique o método de Newton-Bairstow para determinar as demais raízes. 


3.3 - Um amplificador eletrônico com acoplamento R - C com três estágios em cascata tem uma resposta 
a um degrau unitário de tensão dada pela expressão: 


2 


I 
(MD) =1-(1+T+ e À 
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onde T = no é uma unidade de tempo normalizada. O tempo de subida de um amplificador é definido 


como o tempo necessário para sua resposta ir de 10% a 90% de seu valor final. No caso, como g(00) = 1 
é necessário calcular os valores de T para os quais 


ou seja resolver as equações: 


01 = lies) A 
T2 
0.9 = teeta de 


Chamando de To ı o valor obtido de T na 1° equação e To. o valor obtido de T na 2º equação, calcular 
o tempo de subida. 


3.4 - A Figura 3.17 represente o fluxo de água em um canal aberto. 


Figura 8.17 


Uma relação empírica para o fluxo é a equação de Chez-Manning: 


1.49 2 41 
= ——— A 3 2 
Q g ARS, 
onde: 
e Q- fluxo em mB /seg. , 


e E - coeficiente de atrito determinado experimentalmente, valendo entre 0.025 e 0.035 para a maioria 
dos canais e rios , 


e A - área da secção transversal do canal , 


e R - raio hidráulico que é definido como a razão entre a área A e o perímetro 2 C+D , 


e a - inclinação do canal (S = sen a). 
a) Para um canal retangular (8 = 90º), sendo conhecidos Q, E, S, D, verificar que y é a solução 
da equação: 


E 


1.49\ ° 3 
C) p si| y -4y -4REDy- @DP-=0, 


a qual tem apenas uma raiz positiva. 
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b) Encontre as profundidades y do canal correspondente a duas estações A e B, cujos dados 
estão tabelados a seguir: 


D S E Q 
Estação 
(A) 20.0 0.0001 0.080 133.0 
(B) 21.5 0.0001 0.080 122.3 


Em cada caso determinar incialmente intervalo contendo a raiz. 


3.5 - A Figura 3.18 corresponde a um cabo uniforme, como por exemplo uma linha de transmissão 
suspensa em dois apoios e sob a ação de seu próprio peso. 
4 


Y 


Figura 3.18 


A curva correspondente é uma catenária, cuja equação é dada por: 
T z 

y= E (conte a), 
H To 


e To - tração no cabo em x =0, 


onde: 


e u - peso por unidade de comprimento do cabo . 


Em xz = 2 y= f, logo: 


O comprimento S do cabo é dado por: 


2T L 
f = Es (sent E) . 
H 2 To 


Resolva então o seguinte problema: Um cabo de telefone pesando 1.5 Kgf/m está simplesmente 
apoiado em dois pontos cuja distância é de 30 metros. Para um comprimento de cabo de 33 metros qual 
é o valor da flecha f? 
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3.6 - 4 equação: 


0 Sena cosa 
g 2 = gR , 


2 
> — COS“ Q 
v2 


permite calcular o ângulo de inclinação, a, em que o lançamento do míssil deve ser feito para atingir um 
determinado alvo. Na equação acima, 


e a - ângulo de inclinação com a superfície da Terra com a qual é feita o lançamento do míssil , 
e g - aceleração da gravidade = 9.81 m/s? , 
e R-raio da Terra = 6371000 m , 


e v - velocidade de lançamento do míssil, m/s, 


9 - ângulo (medido do centro da Terra) entre o ponto de lançamento e o ponto de impacto desejado 


E 


Resolva o problema considerando: 0 = 80º ev tal que JR = 1.25, ou seja, aproximadamente 
8.840 m/s. 


3.7 - Quando um capacitor carregado é ligado com uma resistência R, um processo de descarga do 
capacitor ocorre. Durante este processo, uma variável no tempo é estabelecida no circuito. Sua variação 
com o tempo se dá de forma decrescente e exponencial, de acordo com a expressão: 


onde I é a corrente, Qo é a carga inicial do capacitor, C sua capacitância, R a resistência e T o parâmetro 
tempo. 

Definindo G(t) = F(t) — I, o instante T em que G(t) = 0, corresponde àquele em que a corrente I 
percorre o circuito. 

Determinar T nos seguintes casos: 


a) I= 0.83 Ampére, Qo =7 coulomb, R=3 Ohms, C = 2 Farad; 
b) Z= 0.198 Ampére, Qo = 20 coulomb, R=9 Ohms, C = 11 Farad. 


3.8 - Uma loja de eletrodomésticos oferece dois planos de financiamento para um produto cujo preço a 
vista é R$ 162,00: 


e Plano A: entrada de R$ 22,00 + 9 prestações iguais de R$ 26,50, 
e Plano B: entrada de R$ 22,00 + 12 prestações de R$ 21,50. 
Qual dos dois planos apresenta a menor taxa de juros, sendo portanto melhor para o consumidor? 
Observação: Sabe-se que a equação que relaciona os juros (J) e o prazo (P) com o valor financiado 
(VE = preço à vista - entrada) e a prestação mensal PM é dada por: 


1-(01+)) Po VF 
J S (3.33) 


a) Fazendox=1+J e k= se. verificar que a equação (3.33 se transforma em: 


f(x) = ket! — (k+ 02? +1=0. (3.34) 
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b) Escrever a equação (8.34) para o problema proposto e encontrar um intervalo contendo a raiz 
positiva £ 1. 


3.9 - Um dos elfos de Valfenda, o grande arqueiro Glorfindel, disparou uma flecha em direção a cidade 
de Bri para cair na cabeça de Cevado Carrapicho, dono da estalagem do Pônei Saltitante. O rei Elessar, 
de Gondor, viu o fato em sua pedra vidente. Junto porém aparecia o seguinte escrito: 


at? 
37.104740 + 3.15122t — e 0. 


Elessar desesperado, pois adorava a cerveja da estalagem, queria salvar Cevado Carrapicho (fabricante 
da cerveja) a qualquer custo; mas apesar de toda sua sabedoria, não entendia o que significavam aqueles 
números. Como ele podia ver o futuro em sua pedra, correu até uma gruta e escreveu numa parede o 
seguinte: 

“Por favor, quem souber o que significa: 


2t2 
37.104740 + 3.15122t — z~ 0, 


me ajude!” 
Elessar esperou por um minuto e colocou sua pedra de forma a ver os escritos e verificou que logo 
abaixo da sua escrita aparecia: 


“t = —4.71623 ou t= 7.86745 , 


que deve ser o tempo de alguma coisa, em horas ou minutos.” 

Elessar levou algum tempo para traduzir a escrita, mas logo correu para ajudar Cevado, pois se ele 
estivesse no alvo depois de 7 horas e 52 minutos seria acertado. Elessar conseguiu chegar a tempo e 
salvou Cevado da morte certa, e comemorou com sua tão amada cerveja... 

Dezenas de milhares de anos depois. ... 

Eric estava vasculhando uma gruta quando encontrou escritos junto a rabiscos. Ele percebeu que os 
rabiscos eram runas élficas, e que aquilo era um pedido de ajuda. 

Graças a Deus e aos Anjos, Eric estava com seu notebook na mochila, e tinha um programa chamado 
Raízes que seu irmão havia instalado para resolver alguns problemas. Depois de alguns segundos tentando 
entender como eram entrados os dados, ele obteve: 


“t = —4.71623 ou t= 7.86745 ,” 
e pensou, isso deve ser alguma coisa, em horas ou minutos. ... 
a) Resolva o problema proposto, e obtenha pelo método de Newton a raiz positiva. 


b) Obter a raíz negativa, usando o polinômio do primeiro grau obtido no esquema de Briot- 
Riffini-Horner. 


3.10 - Na engenharia química, reatores do tipo PFR são frequentemente usados para converter rea- 
gentes em produtos. Sabe-se que a eficiência de conversão às vezes pode ser melhorada reciclando uma 
fração do produto como mostrado na Figura 3.19 a seguir: 


li taçã Produt 
Alimentação R Reator PFR roduto R 


Reciclo 


Figura 3.19 
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A taxa de reciclo é definida por: 


R= volume do fluido que retorna ao reator 


volume do fluido que sai do reator 


Supondo que estamos processando um reagente A a fim de gerar um reagente B, segundo a expressão 


autocatalítica: 
A+B > B+B, 


pode-se mostrar que a taxa ótima de reciclo satisfaz a equação: 


a = 0a)) E R+1 
RQ- za) RIL + R(= za)] ’ 


onde xa é a fração de reagente A que é convertido no produto B. A taxa ótima de reciclo corresponde ao 
reator de menor tamanho possível necessário para se atingir o nível de conversão desejado. Determine as 
razões de reciclo necessárias para se minimizar o tamanho do reator, resolvendo a equação para 
as seguintes frações de conversão (xa), do reagente A no produto B: 


i) za = 0.99, 

ii) są = 0.995, 

iii) sza = 0.999, 

iv) za = 0.9999 , 
v) za = 0.99999 . 


(3.35) 


3.11 - Suponha que tenhamos um circuito temporizador 555 como mostra a Figura 3.20: 


+Va 
o) 
4 8 
Ra 
É E Output 
2 
555 
Rg 
7 5 
C Es ads, 
T+ TT» i lu 
1 


Figura 3.20 
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cuja onda de saída é da forma: 


Figura 3.21 


1 
f 3. 
onde f é a frequência, e o ciclo de trabalho CT, é dado por: 
T 
T = zat- 
T+T 


n+D= 


x 100%. 


Pode-se mostrar que: 


Tı = RACin(92) , 


=D — ESSES t 
2 Ra + Rg E) 


Dado que Ra = 8.670, C =0.1x 102, To = 1.4 x 1074, determine Rg, Ti, f, e o ciclo de trabalho 
CT. 


Ra Rg C I (lã Rg 


3.12 - Um tanque de vaporização flash é alimentado com Fmoles/h por uma corrente de gás natural 
de n componentes, como mostrado na Figura 3.22: 


Figura 3.42 
As correntes de líquido e vapor são designadas por L e Vmoles/h, respectivamente. As frações 


molares dos componentes na alimentação, nas correntes de vapor e de líquido são designadas por z;,yi e 
xi, respectivamente. Assumindo equilíbrio líquido-vapor em estado estacionário, segue que: 


F=L+V, (3.36) 
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Ki e islan. (3.38) 
Ti 


onde: é o balanço global, é o balanço individual , (3.38) é a relação de equilíbrio, e, K; á 


a constante de equilíbrio para o i-ésima componente na pressão e temperatura do tanque. Das equações 
. n n 
acima e do fato de SJ, =D; y = 1, mostra-se que: 


3 VF = 0. (3.39) 


Supondo que F = 1000 moles/h, calcule o valor de V, com duas casas decimais corretas, resolvendo 
a equação (3.40), para a corrente de gás natural, à temperatura de 120ºF e pressão de 1600 psia, para 
cada um dos componentes da tabela a seguir: 


Componentes i Zi Ki 
Dióxido de Carbono 1 0.0046 1.65 
Metano 2 0.8345 3.09 
Etano 3 0.0381 80.72 
Propano 4 0.0163 0.39 
Isobutano 5 0.0050 0.21 
n-Butano 6 0.0074 0.175 
Pentanos 7 0.0287 0.095 
Hexanos 8 0.0220 0.065 
Heptanos 9 0.0434 0.036 


Para cada valor de V, calcule os valores de L, de x; e de yi. 


3.13 - Lee and Duffy (A. I. Ch. E Journal, 1976) relacionaram o fator de atrito para escoamentos de 
partículas fibrosas em suspensão com o número de Reynolds, pela seguinte equação empírica: 


1 1 5.6 
— = | — ) in(RE 14- — |]. 
77 (6) rev (uu O) 

Nesta relação f é o fator de atrito, RE é o número de Reynolds e k é uma constante determinada 
pela concentração de partículas em suspensão. Para uma suspensão de 0.08% de concentração temos que 
k = 0.28. Determine o valor de f quando RE = 3750. 


3.14 - Muitas equações de estado foram desenvolvidas para descrever as relações entre pressão, P, 
volume molar, V, e temperatura, T, de gases. Uma das equações mais utilizadas é equação de Beattie- 


Bridgeman: 

RT B y ô 

P= + + + : 3.40 

V V2? V3 V4 l ) 
onde R é a constante universal dos gases e B, y e d são parâmetros característicos do gás em estudo. 
O segundo, terceiro e quarto termos de (8.40), podem ser vistos como correções da lei dos gases ideais, 
PV = RT, para o comportamento não ideal de um gás. Os parâmetros B, y e ô são definidos por: 

Rec 


8 = RTBo- Ao- 5 
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RcB 
y = —RTBob+ Apa — ~ l 
fo RBobe | 
T2 


onde: Ao, Bo,a,b e c são constantes determinadas experimentalmente e são diferentes para cada gás. 
Dados os valores de pressão, P, temperatura , T, e das constantes R, Ao, Bo,a,b,c é possível determinar 
o volume molar de qualquer gás resolvendo a equação (8.40), usando como estimativa inicial para o 
volume molar a lei dos gases ideais: Vo = Be. Para o gás metano, tem-se que: Ag = 2.2769, Bo = 
0.05587, a = 0.01855,b = —0.01587 e c = 12.83 x 104. Considere temperaturas de 0º e 200º e as seguintes 
pressões em atm: 1,2,5,20, 40, 60, 80, 120, 140, 160, 180 e 200. Com esses dados, determine: 


a) o volume molar do gás metano, com precisão de 1078, 


b) o fator de compressibildade z, onde z = dem. 


b) compare os seus resultados com valores experimentais do fator de compressibilidade para o 
metano de 0º e 200º, apresentados na Figura 3.23: 


zA 
1.03 
200°C 
1.02 
1.01 
1.00 
0.90 
0.80 FO 
[+ 
0.70 > 
0 50 100 150 200 P 
Figura 3.23 


3.15 - Considere o sistema diferencial de segunda ordem: 


q +2+2y +y = f(t) 
2" = 24 y= gl) 
2(0) = (0) = y(0) = 0 
Para resolvê-lo pelo método da transformada de Laplace, torna-se necessário fatorar a expressão (de- 
terminar as raízes): 


(S? +1)(5)— (2S HIS =), 


tal que as frações parciais possam ser usadas no cálculo da transformada inversa. Determine esses fatores 
(raízes). 
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3.16 - Um método muito eficiente para integração numérica de uma função é o chamado método de 
quadratura de Gauss. No desenvolvimento das fórmulas para este método é necessário calcular os zeros de 
uma família de polinômios ortogonais. Uma família importante de polinômios ortogonais é a de Legendre. 
Encontre os zeros do polinômio de Legendre de grau 6(seis): 


1 
P(x) = gl” zº — 945 4º +315 z? — 15). 


Observação: Todos os zeros dos polinômios de Legendre são menores do que 1(um) em módulo e 
são simétricos em relação a origem. 


3.17 - Considere um circuito de polarização que consiste de uma bateria com uma tensão Vg = 2.0 V 
e um resistor R de 50 Q em série, conectado a um diodo semicondutor de estado sólido como mostrado 
na Figura 3.24. 


R 


Figura 3.24 


As características operacionais na gama normal de operação de um diodo são determinadas pela 
equação relacionando suas variáveis terminais de tensão e corrente. Se tomarmos v e i como sendo 
estas variáveis e escolhermos as direçôes de referência relativas mostradas, a equação relacionando estas 
variáveis é dada por: 


i= L (e —1) , (3.41) 
onde: 


e J, é a intensidade de corrente de saturação reversa. Esta é a corrente máxima que flui quando 
o diodo é polarizado em reverso, ou seja, quandov << 0. Ela é função do material usado na 
confecção do diodo, do grau de lubrificação e das técnicas de fabricação particulares. Um valor 
típico para um diodo de silício em temperatura ambiente é 107? Ampére , 


e k éa constante de Boltzmann, que tem o valor: 1.38047 x 102 joule/°K, 
e t é a temperatura absoluta em °K na qual o diodo é operado, 
e q é a carga do elétron que tem o valor: 1.602031071° coulomb. 


Em temperaturas ambientes normais, o valor do termo E é aproximadamente 40. 
Podemos agora proceder à solução do circuito de polarização, ou seja, encontrar os valores de v e à. 
Para isso, basta aplicar a lei das tensões de Kirchoff ao circuito, obtendo assim: 


Vg = iR+v. (3.42) 


Substituindo em (3.42) os valores de Vg e R, e usando a relação dada por (8.41), obtem-se uma 
equação não linear em v. Resolvendo-se esta equação, o valor da corrente de polarização i, é facilmente 
obtido. 
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3.18 - Num escoamento turbulento em uma rede de tubulação interconectada, a razão de escoamento 
V de um nó para outro é proporcional à raiz quadrada da diferença entre as pressões nos nós. Para a 
rede da figura a seguir é solicitado determinar a pressão em cada nó. 


TD 
p = 500, b = 0.3 €, 
K Es 
» A | 
Nan b=0.2 
ZN D 
p=0,b-02 b=0.1 
E D b=0.1 
a 2 
ʻi b=0.2 
cnm U J 
A P; 
b= 0.1 er 
NA 
Figura 3.25 


Os valores de b representam fatores de condutância na relação: 
vij = bij 4/ (Pi — pj) - 


As equações para as pressões em cada nó são então dadas por: 


nó 1 :0.3/500-p = 0.24/pi — p2 + 0.2V pı — P3 , 


nó 2 :0.2Vpı — p2 = 0.1yp2 — p4 + 0.2V p2 — P3 , 
nó 3 :0.1ypı — p3 = 0.2Vp3 — p2 + 0.LV P3 — pa, 
nó 4 :0.1Vp2— pa + 0.l1Vp3 — p4 = 0.2/p4—0. 


onde estamos assumindo que pı > p3; se isso não for verdadeiro é necessário modificar as equações. 
Resolva o sistema dado pelo método de Newton. 


Capítulo 4 


Solução de Sistemas Lineares: 
Métodos Exatos 


4.1 Introdução 


Uma variedade de problemas de engenharia pode ser resolvido através da análise linear; entre eles 
podemos citar: determinação do potencial em redes elétricas, cálculo da tensão na estrutura metálica 
da construção civil, cálculo da razão de escoamento num sistema hidráulico com derivações, previsão da 
concentração de reagentes sujeitos à reações químicas simultâneas. O problema matemático em todos estes 
casos se reduz ao problema de resolver um sistema de equações simultâneas. Também as encontramos, 
quando estudamos métodos numéricos para resolver problemas de equações diferenciais parciais, pois 
estes requerem a solução de um conjunto de equações. 

A solução de um conjunto de equações é muito mais difícil quando as equações são não lineares. 
Entretanto a maioria das aplicações envolve somente equações lineares, muito embora quando o sistema é 
de grande porte devemos escolher o método numérico adequadamente para preservar a máxima precisão. 

Antes de desenvolvermos alguns métodos específicos, discutiremos o que queremos dizer com uma 
solução e as condições sob as quais a solução existe, pois não adianta tentar obter uma solução se não há 
nenhuma. 

Uma equação é linear se cada termo contém não mais do que uma variável e cada variável aparece na 
primeira potência. Por exemplo, 3x + 4y — 10z = —3 é linear, mas xy — 3z = —3 não é, pois o primeiro 
termo contém duas variavéis. Também z + y — z = 0 não é linear, pois o primeiro termo contém uma 
variável elevada ao cubo. 

Vamos considerar n equações lineares com n variáveis (incógnitas) e vamos nos referir a elas como 
um Sistema de n Equações Lineares ou um Sistema Linear de ordem n. Uma solução para esse 
sistema de equações consiste de valores para as n variáveis, tais que quando esses valores são substituídos 
nas equações, todas elas são satisfeitas simultaneamente. 

Por exemplo, o sistema de três equações lineares: 


rı + y + z = |1 
Doi yo = = 1 
2x + 3y — 4z = 9 
tem a solução x = 1,y = 1 e z = —1. O leitor pode verificar a validade das três equações substituindo 


esses valores pelas variáveis no sistema dado. 
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Observe que o sistema acima pode ser escrito na forma matricial como: 


1 1 1 z£ 1 
1 —1 =1 y = 1 
3 —4 z 


De um modo geral um sistema de n equações lineares é escrito como: 


mit + Q12 T2 + Q13 T3... + Qin In = bı 

a21 £1 + Q22 xo + Q23 T3... + am Tn = bo 

agi Tı T Q32 T2 T Q33 T3... T Q2n In = bo (4.1) 
an1 £1 + an2 £2 + AN3 T3... + Ann Un = bn 


e é representado na forma matricial por: 


Q11 a12 ... An Ti bi 
a21 a22 ... An Lo bo 
= : (4.2) 
Ani An2 cc Gmn Tin bn 
ou simplesmente 
Az = b, (4.3) 


onde A é chamada de matriz dos coeficientes, b é o vetor do termo independente e x é o vetor solução. 

Dado um sistema de equações arbitrário, não podemos afirmar sem investigar que há uma solução ou, 
se houver, que seja única. Como pode ser observado a seguir, há três e apenas três possibilidades de se 
classificar um sistema linear. 


Classificação de um Sistema Linear 


A classificação de um sistema linear é feita em função do número de soluções que ele admite, da 
seguinte maneira: 


a) Sistema Possível ou Consistente: E todo sistema que possui pelo menos uma solução. Um 
sistema linear possível é: 


(a.1) determinado se admite uma única solução, e, 


(a.2) indeterminado se admite mais de uma solução. 


b) Sistema Impossível ou Inconsistente: É todo sistema que não admite solução. 
O próximo exemplo ilustra a classificação de um sistema linear. 


Exemplo 4.1 - Classificar os seguintes sistemas lineares: 


a 


CAPÍTULO 4. SOLUÇÃO DE SISTEMAS LINEARES: METODOS EXATOS 110 


r + y = 1 

and 2x + 2y = 2 
zx + y = 1 

amf a de Ci 


Solução: Consideremos o sistema (I). A solução é z = 4 e y = 2; nenhum outro par de valores de x e 
y satisfaz ambas as equações. Esse sistema é representado geometricamente pela Figura 4.1. Qualquer 
ponto da reta rı tem coordenadas que satisfazem a primeira das equações em (I). Do mesmo modo, todos 
os pontos em rs satisfazem a segunda equação de (I). Os pontos que satisfazem ambas as equações devem 
localizar-se em ambas as retas. Há somente um ponto assim. As coordenadas desse ponto são a solução 
que procuramos. Logo, o sistema (I) admite como única solução o par (4, 2)*. Portanto (I) é um sistema 


possível e determinado. 


A 


Ti 


l 
| 
4 


A Figura 4.1 


Consideremos agora o sistema (IN). A Figura 4.2 mostra o gráfico dessas duas retas. 
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Figura 4.2 


Observe que geometricamente as retas x + y = 1 e 2 x +2 y = 2 são coincidentes. Assim, para o 
sistema (II), temos que os pares (0, 1)*; (1, 0)*; (0.5, 0.5)*,..., são soluções, isto é, o sistema admite 
infinitas soluções. Logo (II) é um sistema possível e indeterminado. Finalmente, consideremos o sistema 


(III). Novamente, colocando as duas retas no mesmo gráfico, obtemos a Figura 4.3. 
4 


Figura 4.3 


CAPÍTULO 4. SOLUÇÃO DE SISTEMAS LINEARES: METODOS EXATOS 111 


Observe que geometricamente as duas retas são paralelas. Assim, para o sistema (II), as duas 
equações são contraditórias, isto é, não é possível que se tenha simultaneamente z + y = lex +y=4. 
Logo (III) é um sistema impossível. 


Nosso objetivo aqui será o de desenvolver métodos numéricos para resolver sistemas lineares de ordem 
n, que tenham solução única. Observe que tais sistemas são aqueles onde a matriz dos coeficientes é não 
singular, isto é, det(A) 0. 


Antes de descrevermos em detalhes os métodos de solução, vamos examinar quais os caminhos mais 
gerais para se chegar a elas. 


Métodos numéricos para solução de sistemas de equações lineares são divididos principalmente em 
dois grupos: 


- Métodos Exatos: são aqueles que forneceriam a solução exata, não fossem os erros de arredondamento, 
com um número finito de operações. 


- Métodos Iterativos: são aqueles que permitem obter a solução de um sistema com uma dada precisão 
através de um processo infinito convergente. 


Assim, os métodos exatos em princípio, ou seja desprezando os erros de arredondamento, produzirão 
uma solução, se houver, em um número finito de operações aritméticas. Um método iterativo, por outro 
lado, iria requerer em princípio, um número infinito de operações aritméticas para produzir a solução 
exata. Assim, um método iterativo tem um erro de truncamento e o exato não tem. Por outro lado, em 
sistemas de grande porte os erros de arredondamento de um método exato podem tornar a solução sem 
significado, enquanto que nos métodos iterativos os erros de arredondamento não se acumulam. Veremos 
entretanto, que ambos são úteis, ambos têm vantagens e limitações. 


Neste capítulo estudaremos somente métodos exatos e no Capítulo 5 os métodos iterativos. 


Voltemos ao exemplo [4.1] Observando a Figura 4.1 vê-se facilmente que poderíamos traçar infinitos 
conjuntos de duas retas concorrentes cuja intersecção fosse o par (4, 2)*. Cada um desses conjuntos 
formaria um sistema de duas equações lineares que teriam portanto a mesma solução. Assim definimos: 


Definição 4.1 - Dois sistemas lineares são equivalentes quando admitem a mesma solução. 


Com base na definição [4.1]não fica difícil deduzir que uma maneira de obter a solução de um sistema 
linear através de métodos numéricos é transformá-lo em outro equivalente cuja solução seja facilmente 
obtida. Em geral, nos métodos exatos, transformamos o sistema original num sistema equivalente, cuja 
solução é obtida resolvendo-se sistemas triangulares. 


Solução de Sistemas Triangulares 


Como já dissemos, resolver sistemas triangulares é muito fácil; entretanto, apresentaremos aqui a 
solução de tais sistemas com o objetivo de auxiliar a elaboração de projetos que envolvam a resolução 
dos mesmos. 


i) Um sistema linear de ordem n é triangular inferior se tiver a forma: 
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G1 Tı = b 
Q21 Tı T Q22 T2 = b 
a31 £1 + ago T2 + Q33 T3 = b 
Ani T1 + ano T2 +... + ünn In = bn 
onde ai £0, i = 1,2,...,n. Assim a solução de um sistema triangular inferior é obtida por substituição 


direta, isto é, determinamos o valor de zı na primeira equação; substituímos esse valor na segunda 
equação e determinamos o valor de x2 e assim por diante. Algebricamente podemos resolvê-lo pelas 
fórmulas: 


bı 
T = mn 
oi (4.4) 
T 
r a T as 
Ti E Gii z 1 Igen. 
ii) Um sistema linear de ordem n é triangular superior se tiver forma: 
mit + w2x2 + asi... + Qin In = bı 
a22 xo + Q23 T3 ... + am In = bo 
Q33 T3 ... T Agn Tn = bn 
Ann Tn = bn 
onde a;; £ 0; i = 1,2,...,n. Assim a solução de um sistema triangular superior é obtida por retro- 


substituição, isto é, determinamos o valor de x, na última equação; substituímos esse valor na penúltima 
equação e determinamos o valor de x,-1 e assim por diante. Algebricamente podemos resolvê-lo pelas 
fórmulas: 


g (4.5) 
ao BED oe, 


Gii 
Portanto, para resolvermos nosso problema falta explicar como um dado sistema linear de ordem 
n pode ser transformado num outro equivalente cuja solução seja obtida resolvendo-se sistemas trian- 
gulares. Como veremos, os métodos numéricos apresentados nesse capítulo explicam como fazer isso. 
Antes, porém, daremos algumas definições que julgamos necessárias para um melhor entendimento de 
tais métodos. 


Definição 4.2 - Uma matriz triangular inferior é uma matriz quadrada C = (cij) tal que cij = O para 
i< j. Do mesmo modo, se cij = 0 para i > j,C é uma matriz triangular superior. 


Definição 4.3 Seja A uma matriz n x n da forma: 


Q11 Q12 Gm 
Q21 Q22 Am 

A = (4.6) 
An1 an2 Ann 
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Os menores principais de A de ordens 1,2,...n são definidos pelas sub-matrizes de A: 


Q11 412 ak 
Q21 Q22 Q2k 

Ak = ; k = 1, 2, n 
Aki Qk2 kk 


Definição 4.4 - Uma matriz real simétrica A, n x n, é positiva definida se para todos os menores 
principais Ap, constituído das k primeiras linhas e k primeiras colunas vale: det(A) > 0, k = 
Zica seas 


4.2 Decomposição LU 


Inicialmente veremos em que condições podemos decompor uma matriz quadrada A = (aij) no 
produto de uma matriz triangular inferior por uma matriz triangular superior. 


Teorema 4.1 - Teorema LU - Seja A = (aij) uma matriz quadrada de ordem n, e Ay o menor 
principal, constituído das k primeiras linhas e k primeiras colunas de A. Assumimos que det( Ap) £ 0 
para k = 1,2,...,n — 1. Então existe uma única matriz triangular inferior L = (lij), com ty = 
b22 =... = lnn = 1, e uma única matriz triangular superior U = (uij) tal que LU = A. Além disso, 
det(A) = U11U22 . . . Unn- 


Prova: Para provar esse teorema usaremos indução sobre n. 


1) Se n = 1, temos que: a = 1-am = 1- uj1 unicamente, e assim A = LU onde L = 1 e U =un. 
Além disso, det(A) = u11. 


2) Assumimos que o teorema é verdadeiro para n = k — 1, ou seja que toda matriz de ordem (k — 1) 
é decomponível no produto LU nas condições do teorema. 


3) Devemos mostrar que a decomposição pode ser feita para uma matriz de ordem n = k. Seja então 
A uma matriz de ordem k. Partimos essa matriz em sub-matrizes da forma: 


Ap T 
A = ; 
S Akk 


onde r e s são vetores coluna, ambos com k — 1 componentes. 

Note que a matriz Aķ—ı é de ordem k — 1 e satisfaz as hipóteses do teorema. Portanto pela hipótese 
de indução esta pode ser decomposta na forma Ay 1 = Ly-1Uk-1. Utilizando as matrizes Lp 1 e Upa 
formamos as seguintes matrizes: 


m 1 0 Ukk 


onde m e p são vetores coluna, ambos com k — 1 componentes. Note que m, p e ukk são desconhecidos. 
Assim, impondo que a matriz A seja decomponível em LU vamos tentar determiná-los. 
Efetuando o produto LU, segue que: 


Lk—1Uk-1 Lea p 
LU = 
mt Up mt p+ ükk 
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Estudemos agora a equação LU = A, isto é: 
Lk-1Uk-1 Le-1 P Ap-1 r 
mt Us MÝ p + ükk s ükk 
Da igualdade acima concluímos que: 


Lk-1Uk-1 = Ap, 
Lea p=", 
m Up = st , 
mp+Husk = akk. 
Observe que a primeira equação é válida pela hipótese de indução, e portanto Lp, e Uķk—-ı são 


unicamente determinadas. Além disso, nem Ly-1 e nem Up—ı são singulares (ou Ay, também seria 
singular, contrariando a hipótese). Assim de: 


=] 
Le P r p k=1 7 
mt Up st mt s U74, 
t $ 
m p+uUkk = ükk > Ukk = Gk>M p. 


Portanto p,m e ukk são determinados univocamente nesta ordem, e L e U são determinados unica- 
mente. Finalmente, 
det(A) = det(L) - det(U) 
= 1-det (Up-1) *Ukk 
= Ujugo...... Uk—1,k—1Ukk » 


completando a prova. 


Cabe salientar que a decomposição LU fornece um dos algoritmos mais eficientes para o cálculo do 
determinante de uma matriz. 


Esquema Prático para a Decomposição LU 


Observe que teoricamente, para obtermos as matrizes L e U, devemos calcular a inversa de Ly 1 e 
Us-1. Entretanto na prática podemos calcular L e U simplesmente aplicando a definição de produto e 


de igualdade de matrizes, isto é, impondo que LU = A. Seja então: 
1 uil U12 u13 e... Uin 
ta 1 O U22 U23 P Wn 
LU = | Ea te 1 U33 o Un |, 
lni lno ln ses À Unn 


e a matriz A como em (4.6). 


Para obtermos os elementos da matriz L e da matriz U devemos calcular os elementos das linhas de 
U e os elementos da colunas de L na seguinte ordem: 
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1º linha de U: Fazendo o produto da 1º linha de L por todas as colunas de U e igualando com os 
elementos da 1º linha de 4, obtemos , 


l- u a11 u11 aq , 
1- u12 a12 u12 a12, 
1- Ulin Qin Uin Qin ; 
> Wj = @j, J=1,2,...,n. 


1º coluna de L: Fazendo o produto de todas as linhas de L, (da 2º até a nº), pela 1º coluna de U e 
igualando com os elementos da 1º coluna de A, (abaixo da diagonal principal), obtemos , 


a21 
to um a21 tar ER: 
u11 
a31 
L31 um a31 L31 ~ 
uia 
an1 
lni WU Ani lni F 
Uui 
Qil ; 
> ta = —, i=2,...,n. 
u11 


2º linha de U: Fazendo o produto da 2º linha de L por todas as colunas de U, (da 2º até a nº), e 
igualando com os elementos da 2º linha de A, ( da diagonal principal em diante), obtemos , 


Lo u12 + U22 Q22 u22 a22 — l21U12 , 

Lo u13 + U23 423 u23 a23 — l21U13 , 

Lo Uin + Un a2n U2n a2n — lrun , 
> u2; = a2; — Loyurj, J = Ipero 


2º coluna de L: Fazendo o produto de todas as linhas de L ( da 3º até a nº) pela 2º coluna de U e 
igualando com os elementos da 2º coluna de A, ( abaixo da diagonal principal), obtemos , 


a32 — l31U12 
L31 U12 + l32U22 432 L32 wan 5 
U22 
as2 — Caruso 
ta U12 + lazua a42 la2 e e) 
U22 
an2 — niun 
lni U12 + ln2u2 an2 lanz >» 
U22 
Giz — lizun ) 
> l2 = |, 4=3..sn. 


U22 
Se continuarmos calculando 3º linha de U, 3º coluna de L, 4º linha de U, 4º coluna de L, ete ..., 
teremos as fórmulas gerais: 
i a 
uj = ij — Ei likükj» i<j, 


| (4.7) 
bj = (ais - Sã Livus) [ujj i>i. 
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Observe que a convenção usual de sa =0sek<1, deve ser utilizada aqui. 


Aplicação à Solução de Sistemas Lineares 

Vejamos agora como podemos aplicar a decomposição LU para obtermos a solução de sistemas line- 
ares. 

Seja o sistema Ax = b de ordem n determinado, onde A satisfaz as condições da decomposição LU. 
Então o sistema Ar = b pode ser escrito como: 


LU = b. 


Assim transformamos o sistema linear Ax = b no sistema equivalente LU x = b cuja solução é facil- 
mente obtida. De fato: fazendo Ux = y, a equação acima reduz-se a Ly = b. Resolvendo o sistema 
triangular inferior Ly = b, obtemos o vetor y. Substituindo o valor de y no sistema Ux = y obtemos um 
sistema triangular superior cuja solução é o vetor x que procuramos. 

Assim, a aplicação da decomposição LU na resolução de sistemas lineares requer a solução de dois 
sistemas triangulares. 

Exemplo 4.2 - Seja: 
5 2 1 
A = 3 1 4 
1 1 3 


a) Verificar se A satisfaz as condições da decomposição LU. 
b) Decompor A em LU. 
c) Através da decomposição LU, calcular o determinante de A. 


d) Resolver o sistema Ax = b, onde b = (0, —7, —5)*, usando a decomposição LU. 
Solução: 


a) Para que A satisfaça as condições da decomposição LU devemos ter: det(A1) # 0 e det( A2) £ 0. 
Temos que: det(Aj) =5 #0 e det(A2) = —1 # 0. Logo A satisfaz as condições do teorema. 


b) Usando as fórmulas (4.7), obtemos: 
Para a 1º linha de U: 
ui; = 05; j = 1,2,3 > um=5, us =2, ug =l. 


Para a 1º coluna de L: 


Qil ; 3 1 
ta = —, 2,3 £ =, bg =0 
1 1 21 5 31 5 
Para a 2º linha de U: 
u2; = @zj— b21 Wj, j = 2,3 > 
3 1 3 17 


U22 = l= X2 = =y , tas SAn xl = —. 
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Para a 2º coluna de L: 


1 
=, 1l-:x2 
Poni SO PR bzo = 3 iae 
U22 TE 


E finalmente para 3º linha de U, obtemos: 


1 17 
u33 = a33 — b31 U13 — b32 U23 > U33 = 3 5 x1 ( 3) x 5 = 13. 
Então: 
1 O 5 2 1 
L= {| 35 1 H= —1/5 17/5 
1/5 -3 1 O 13 


c) det(A) = um u22 u33 => det(A) =5 x (-2) x13 > det(A) = -13. 


d) Para obter a solução do sistema Ax = b, devemos resolver dois sistemas triangulares: Ly = b e 
Ur =y. 


d.1) Assim de Ly = b, isto é, de: 


1 O yı 0 
35 1 y k= (ter 
1/5 -3 1 y3 -5 
obtemos: 
y = 0, 
3y +y = -7 = -7 
PYT Y= > y2 = , 
Les = 5 = 26 
sm + (-3gy + y3 = > ya = 


Logo, a solução do sistema Ly =b é y=(0, —7, —26)!. 


d.2) De Ux = y, isto é, de: 


5 2 1 EI 0 
-1/5 17/5 z2 | = -7 |, 
O 13 T3 -26 
segue que: 
13 43 —26 T3 —2, 
-i m + M g; = -7 > m = l, 


Sa + 2zt2 + z3 = 0 > tı = 0. 


Logo, a solução do sistema Ux = y é x= (0, 1, —2)t. 


Assim, a solução de Ax = b, isto é, de: 


5 2 1 zı 0 0 
3 1 4 T2 = —7 ér = 1 
113 T3 —5 — 
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Exercícios 


4.1 - Aplicando-se o método da decomposição LU à matriz: 


4 —1 10 8 
A= o e gh | 
0 —2 5 10 
obteve-se as matrizes: 

0 —1 5 
DE e Ara iba Re 1 ... —2 
i 3 0O... 0 > U = rea 0 3 —4 
0 1 0 ses 0 10 


Preecher os espaços pontilhados com valores adequados. 


4.2 - Considere o sistema: 


5 Tı + 2 Ta E T3 = —12 
=p TF 4 Ta T 2 lg = 20 
2 Ti = 3 Ty TT 10 lg = 3 


a) Resolva-o usando decomposição LU. 
b) Calcule o determinante de A, usando a decomposição. 


4.3 - Seja A, nx n, decomponível em LU. Sejam A;, i = 1,2,..., n, os menores principais de ordem 
i. Mostre que: 


Uii = = Zu 


onde : 


A; = detA;, An = detA, e Ao = il; 


4.4 - Considere a matriz A, n x n, com todas as sub-matrizes principais não singulares. Exiba as 
fórmulas da decomposição LU, onde L é matriz triangular inferior e U é matriz triangular superior com 
1 na diagonal. 


4.5 - Resolver o sistema Ax = b, onde: 


2 3 —1 zı 4 
A=ļ| 1 0 2 |; z=| r2 |; b= 3 i 
0 3 -1 T3 2 


usando a decomposição LU do exercício [4.4] 


4.6 - Mostre que se À satisfaz as hipóteses da decomposição LU então A se decompõe de maneira única 
no produto LDU, onde L eU são matrizes triangulares inferior e superior, respectivamente, ambas com 
1 na diagonal, e D é matriz diagonal. Além disso, det(A) = diidə22 . . . dnn. 


4.7 - Mostre que se A é uma matriz simétrica e satisfaz as hipóteses da decomposição LU então 
A= LDU implica U = Lt (transposta de L). 


4.8 - Mostre que se A é uma matriz simétrica, positiva definida e satisfaz as hipóteses da decomposição 
LU então A = LDL* onde os elementos diagonais de D são todos positivos. 
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4.3 Método de Eliminação de Gauss 


Seja o sistema linear Ax = b, onde A tem todas as submatrizes principais não singulares. 

O método de Eliminação de Gauss, também chamado de método de Gauss Simples, consiste 
em transformar o sistema dado num sistema triangular equivalente através de uma sequência de operações 
elementares sobre as linhas do sistema original, isto é, o sistema equivalente é obtido através da aplicação 
repetida da operação: 


“substituir uma equação pela diferença entre essa mesma equação e uma outra equação multiplicada 
por uma constante diferente de zero”. 


E claro que tal operação não altera a solução do sistema, isto é, obtem-se com ela outro sistema 
equivalente ao original. O objetivo é organizar essa sequência de operações de tal forma que o sistema 
linear resultante seja triangular superior. 


Descrição do algoritmo: 


Considere o sistema linear dado por (4.1). Em primeiro lugar montamos a matriz aumentada: 


1 1 1 1 1 
a ads da ser dA bi 
1 1 1 1 1 
na ns na a Da b, À 
1 1 1 1 1 
an ao dis Ee as b$ ) ? 
ab) asd as Te ab) ob 
onde para i, j = 1,2,...,n, mr = Qij è p = bi. 


Por hipótese temos que a® Æ 0, pois det(Aı) Æ 0. 


Primeiro Passo: Eliminar a incógnita xı da 22, 32, ..., na equações (isto é, zerar os elementos da 
3 3 j q , 
primeira coluna abaixo da diagonal): para isso, substituímos a 2º, 3a, ..., nº equações, respectivamente, 


pela diferença entre a 22 equação e a 12 equação multiplicada por dor 
a 


( 

1 

( 
pela diferença entre a 32 equação e a 12 equação multiplicada por =. 

1 


pela diferença entre a na equação e a 12 equação multiplicada por cen. 
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Passamos então da matriz inicial à matriz: 


1 1 1 1 1 
dia! ai ais ups a pe? 
2 2 2 2 
a?) as? e a? bs ) 
a) ad) iba a) pP 
onde: a 
(2) u aa) (1) 4i 
Qij = Qij — Qij +» 
11 
USD dra 
j = 1,2,...,n 
2) E ne 
b: = b- po” Silo , 
i i il: al) 
11 
Observe que da fórmula acima deduzimos que: 
1 1) (1 1) (1 
BD — a) wa o asp al? — algas) o det( A2) 0 
lo t S — RAE — I 5y #0, 
(1) (1) (1) 
aii aii aii 


pois por hipótese det( A2) £ 0 e det(A1) = af) £0. 
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Segundo Passo: Eliminar a incógnita x» da 32, 48, ..., nº equações (isto é, zerar os elementos da 
segunda coluna abaixo da diagonal); para isso, substituímos a 32, 48, ..., nº equações, respectivamente, 


pela diferença entre a 32 equação e a 22 equação multiplicada por E) 
a 


A 
N 
Z| 


pela diferença entre a 42 equação e a 2a equação multiplicada por m2 
a 


pela diferença entre a na equação e a 2a equação multiplicada por Uno 


Obtemos então a matriz: 


1 1 1 1 1 

E E capo E 

2 2 2 2 

as) as? ir as) bP 

3 3 3 
Pp, 

DBO 
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onde: 


a? 


51 


a — 


ij 


2) Qiz 
2)? 
E a 
3,4, R E 
2,3,..5n 
as, 
9 
a% 
(n—1) 


E assim sucessivamente, chegaremos ao (n-1)º Passo. Temos que AA no 


det(An-1) 0. 
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Æ 0, pois por hipótese 


(n-1)e Passo: Devemos eliminar a incógnita x, 1 da nº equação (isto é, zerar o elemento da (n — 1)a 
coluna abaixo da diagonal); para isso, substituímos a nº equação 


pela diferença entre a nº equação e a (n-1)e equação multiplicada por 


matriz: (a) (a) 
Qil i2 


(2) 


a22 


onde: 


(k+1) 


a. — 


1 


ab) 


13 


2 
ns 


(3) 


433 


pi) o 


a) 


ij 


(k) Qik 
kj (k)? 
r ak k 
k=1,2,...,n—1 
i=k+1,...,n, 
j=k,k+1,...,n 
al) 
plo) i,k 
k J? 
Cpo 


(n—1) 
CDS e assim, obtemos a 
n—l,n—1 
1 1 1 
TEE di bf ) 
2 2 92 
pa O bo? 
3 3 3 
ahai as dó ) 
n—1 n—l n—1 
EE aa pin ) 
aka bh 
n—l1 
(n—1) da 
n—1,9 (n—1) , 
n—l,n—1 
VN, 
j=n-—ln 
(dai AA 
ba m-i) , 
n—l;n—1 


(4.8) 
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Portanto, o sistema triangular obtido, 


aa + ab xo + alba +... + af) Ena + ar, = bh 
+ a xo + a) xa HE: ga SÉ af) itn + aen = bP 
a) £3 E pra af?) itni + a mn = bE? 

aai Fa aat S 


é equivalente ao original. 


Observações: 


1) No 2° passo, repetimos o processo como se não existisse a 1° linha e a 1º coluna da 2º matriz, isto 
P » rep P ; 


2) 


3) 


é, todas as operações são realizadas em função da 2º linha da matriz obtida no 1º passo. De um 
modo geral, no (k)º passo, repetimos o processo como se não existissem as (k — 1) primeiras linhas 
e as (k — 1) primeiras colunas da kè matriz, isto é, todas as operações são realizadas em função da 
linha (k) da matriz obtida no passo (k — 1). 


A operação: substituir uma equação pela diferença entre essa mesma equação e uma outra equação 
multiplicada por uma constante diferente de zero, é equivalente a realizarmos o seguinte cálculo 
(descreveremos para o (kº) passo): 


2.1) Determinar as constantes ab) / a) ; 


k+1 , > : : i . 

tai ) será então obtido fazendo-se na matriz anterior a diferença entre o ele- 
Rem ON k 

mento que ocupa a mesma posição, isto é, (af) 


que se encontra na mesma coluna da linha k, ou seja, pelo elemento (ai 


2.2) Um elemento a 


e o produto da constante at ab) pelo elemento 
ik / lkk 


O elemento a) é o pivô do ke passo. 


Exemplo 4.3 - Resolver o sistema: 


6 2 -1 EA 7 
24 1 Tə = TN 
3 2 8 T3 13 


usando o método de Eliminação de Gauss. 


Solução: Montamos incialmente a matriz, 3 x 4: 
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le Passo: Temos que: 


o Die aD HA ed 
So og DP DP Tog = 
11 11 
Assim: 
(1) 
1 
as = aP — ab = > a% =2-6x5 > as) = O 
ai 
(1) 
2 1 a 2 1 2 10 
a2 = a£} — as; a = a =4-2x5 > a% no 
ai 
2 (1) a 2) Oana 
digo = @33 di a) 7 023 =1-(-1)x z => 3 = 3º 
ai 
be a pD pt) as bp) 1 pl?) = 14 
20. = db 1a) DA TRA e = 
air 
2 a a ar (2) 1 (2) 
@3 = us m P fr SÓ > ai = 0, 
ai 
o MD ma oL 1 2) — 
Uso = qa — üiz -5 = agg FARRS > a = 1, 
air 
(2) a) af (2) 1 (2) 17 
O = -Q33 Ui a T l8 =8-(-1) x3 = 433 = z’ 
11 
(2) aparia (2) 1 2) — 19 
bO = GU a P a-i =, 
a® 2 2 
11 
Assim ,obtemos a matriz: 
6 23 =i 7 
O 10/3 4/3 | 14/3 
0O 1 17/2 | 19/2 
2e Passo: Temos que: 
as) o 1I 3 
a) 03 T0 
Assim: 
(2 
3 2 2) Q 3 10 3 3 
d = da estada O a =1- 7 xg > =0, 
22 
(3) O (2) ab (7 4 3 (8) 8l 
a33 = @33 — 023 (3 “3 53 T3 jo 7 “8 5 jp’ 
a22 
2 
O - a asa RE DR a TEA (9) 8 
so 5 b -0 -O 3 Co 90 3 2 10: 
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Portanto, obtemos: 


6 2 -1 | T 
10/3 4/3 | 14/3 ; 
O 81/10 | 81/10 
ou seja: 
6 2 —1 Tı 7 
0 10/3 4/3 T2 = 14/3 
0 0 81/10 T3 81/10 


Resolvendo então o sitema linear, obtemos: 


Datina usagi, 


Gra + 2 t2 — x = 7 > tı = 1. 


Assim, a solução de: 


6 2 —1 zı T 1 
3 4 1 Lo = 7 é x = 1 
3 2 8 T3 13 1 


(k) — 
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Observação: Se em algum passo k encontrarmos a} = 0, isso significa que det(A) = O. Nesse caso, 
o sistema ainda pode ter solução determinada (basta que det(A) # 0). O método pode ser continuado 
simplesmente permutando a ke equação com qualquer outra abaixo cujo coeficiente da ke incógnita seja 


#0. 
Exemplo 4.4 - Resolver, usando o método de Eliminação de Gauss, o sistema: 
3x1 pe 319 UE lg = 7 
211 Te 239 = lg =S 3 
Tı — Xv + r3 = 5 


Solução: Aplicando o método de Eliminação de Gauss à matriz: 


3 3 1 |7 
2 2 —1 | 3 , 
1 —1 5 |5 
obtemos: 
3 3 1 | T 
0 0 —5/3 | —5/3 
0 —2 14/3 | 8/3 


(2) 


Vemos aqui que o elemento as, = 0 e como já dissemos anteriormente, isso significa que det( A2) = 0. 


3 3 


De fato: det( A2) = | 
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2 x ; 
Como o elemento a) * 0, permutamos a 3e equação com a 2º e assim obtemos a matriz: 


3 3 1 | 7 
—2 14/3 | 8/3 
O —5/3 | —5/3 
a qual já está na forma triangular. Assim a solução de: 
321 kn 319 T T3 = T 1 
2x1 = 2x9 e T3 =3 é41 = 1 
To — 1x9 + 5r3 = 5 1 


Observações: 
1) O método de Eliminação de Gauss pode ser interpretado como um método para obtenção das 


matrizes L e U da decomposição LU. De fato, chamando de (Alb)(D a matriz aumentada, o cálculo feito 
para obtenção de (Alb), é equivalente a multiplicar (A/b)(D por uma matriz Mi, onde: 


1 
—Ma1 1 aW 
Mı = , com my= i=2,3...,Nn. 
a® 
i1 
—Mn1 1 
Assim, (Ab) = Mi(Ajb)D. 
De maneira semelhante: (Alb)) = Ma(Alb)D, onde: 
1 
1 a2 
Mə = —M32 1 , com Mia = 45 PES E 
22 
—Mn2 1 
e assim sucessivamente. Logo: 
(AO = Ma(AbOC-D = ... = Mia M (Aļfb)® . 
—— 
M 
Assim, temos: A) = MAD = MA = U ( onde U é matriz triangular superior da Decom- 


posição LU). Como M é um produto de matrizes não singulares então é inversível; logo existe M7! = 
My +M; ... M} e portanto A = M-IU. 


É fácil verificar que: 


1 
M21 1 

M! = Msı my 1 = L, 
Mni Mn2 1 


onde L é a matriz triangular inferior da decomposição LU. 
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Assim o método de Eliminação de Gauss nada mais é do que o método da Decomposição LU. 
Observe que devemos resolver apenas o sistema Ux = bl"), desde que o vetor final b) é obtido de b 
através da equação: b = Lb™), Assim, se Ax =b , A = LU, b = Lb”), obtemos: 


LUx = Eb?) Ur=b™ , 


pois, como já dissemos, L é não singular. Portanto, o vetor solução x é obtido resolvendo-se apenas um 
sistema triangular. 


2) O exemplo [4.4]apresenta um sistema de equações para o qual as hipóteses do Teorema[4.1|não são 
satisfeitas. Entretanto, resolvemos o sistema utilizando a estratégia de troca de linhas. Para visualizar 
porque isso foi possível, observe que podemos construir uma matriz P, chamada matriz de Permutação, 
a qual será formada pela permutação das linhas da matriz identidade, de forma que em cada linha o único 
elemento não nulo é igual a 1. Se durante o processo não permutamos as linhas do sistema então P é a 
matriz identidade. Agora se durante o processo permutamos a linha į com a linha j então na matriz P 
a linha à será permutada com a linha j. No exemplo [4.4] permutamos durante o processo a linha 2 com 
a linha 3. Assim: 


1 00 3 3 1 
L=[|[1/310),U=[o0-2/14/3 
2/3 0 1 0 O —5/3 


e a matriz P nesse caso será: 


Pode ser visto facilmente que com a troca de linhas a decomposição obtida não satisfaz a igualdade 
A = LU, mas satisfaz PA = LU, isto é, o produto LU reproduz a matriz A com suas linhas permutadas. 
Assim foi possível resolver o sistema do exemplo[4.4]pois a troca de linhas na decomposição funciona como 
se tivéssemos efetuado troca de linhas no sistema antes de começarmos a decomposição. A estratégia de 
troca de linhas para resolver um sistema é extremamente útil para os métodos baseados na decomposição 
LU e é conhecida como pivotamento. Descreveremos mais adiante o método de Eliminação de Gauss com 
pivotamento parcial. 


Exercícios 


4.9 - Considere o sistema: 


2 —3 1 zı —9 
4 —6 -1 Ta = —T 
1 2 q T3 4 


a) Resolva-o pelo método de Eliminação de Gauss, 
b) Calcule o determinante de A, usando a matriz triangular obtida no item a). 


4.10 - Verificar, usando o método de Eliminação de Gauss, que o sistema : 


Wi + 2x9 Sie T3 = 3 
2x1 ae 3x2 E lg = 5 
321 E 5x92 = 2x3 = 1 


não tem solução. 
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4.11 - Usando o método de Eliminação de Gauss, verificar que o sistema: 


zı + 4x + arz = 6 
2x — t2 + 2axs = 3 
ax + 3x + T3 = 5 


a) possui uma única solução quando a = 0; 
b) infinitas soluções quando a = 1 e 


c) não tem solução quando a = —1. 


4.4 Método de Gauss-Compacto 


Como vimos, o método de Eliminação da Gauss nada mais é do que o método da Decomposição LU: 
a matriz triangular superior obtida ao final da aplicação desse método é a matriz U da decomposição LU 
(Æ) 
e a matriz L é a matriz formada pelos multiplicadores ( as constantes E do ke passo). 
kk 


Descreveremos agora uma maneira prática de se obter as matrizes L e U, bem como armazená-las de 
uma forma compacta. Tal método recebe o nome de método de Gauss-Compacto. A vantagem desse 
método é a de economizar espaço na memória, pois ambas as matrizes L e U são armazenadas sobre a 
matriz original A. O único incoveniente é que a matriz A é destruída. O termo independente b, é trans- 
formado juntamente com a matriz 4, como no método de Gauss simples. Esse procedimento é bastante 
usual e conveniente para simplificar a programação desses métodos. Ao final teremos armazenados as 
matrizes L, U e o termo independente modificado. A solução do sistema será obtida resolvendo-se apenas 
um sistema triangular superior. 


Descrição do algoritmo: 


Considere o sistema linear, de ordem n, dado por (4.1). Em primeiro lugar montamos a matriz, 
nxn+l: 


Q11 Q12 Q13 ... din | QAl,n+1 

Q21 Q22 Q23 ... QA2n | Q2,n+1 

a31 Q32 Q33 ... Q3n | G3,n41 p 

And An2 An3 e. Ann | An, n+1 
onde Qi n+1 = bi, 1 = 1, 2, cas 

A seguir construímos a matriz, n x n + 1, onde os termos independentes b; = ai n41, i=1,...,;n por 

serem obtidos da mesma maneira que os elementos u;; serão chamados u;n+1, t = 1,...,n. Assim, sobre 
a matriz original armazenamos a matriz: 

Uil Ui2 U13 ... Um | Ul,n+1 

to U22 U23 UM | U2 n+1 

ta Lao usa ... Um | Usa j 

lni Ln ln Unn | Un,n+1 


a qual é obtida através das fórmulas da decomposição LU, (fórmulas (4.7)), levando em consideração a 
lei de formação das mesmas, na seguinte ordem: 
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a) le linha : uij = Qij; J = 1,2,... n4 1, 


(isto significa que 1e linha é igual a 1ə linha da matriz original) . 


b) 1º coluna: ta = ER SBc 


(isto significa que a 1: coluna é igual ao elemento que ocupa a mesma posição na matriz original dividido 
por a11 pois uil = a11). 


c) 2a linha : us; = 42; — l21U1j, j=2,... n+ l1, 


(isto significa que a 2e linha é igual a diferença entre o elemento que ocupa a mesma posição na matriz 


original e o produto da 2: linha pela coluna j na segunda matriz, com j = 2,...,n +1). 
a . .— %2 — lau. ;— ; 
d) 2º coluna: fa A i=3,..5,n; 


(isto significa, que a 2º coluna é igual a diferença entre o elemento que ocupa a mesma posição na matriz 
original e o produto da linha à pela 2: coluna, tudo dividido por u22, com i =3,...,n). 


e) Segue-se calculando: 3: linha, 3º coluna,..., 


lembrando que as linhas são calculadas da diagonal (inclusive) em diante, e as colunas da diagonal (ex- 
clusive) para baixo. Assim, o elemento u;; é a diferença entre o elemento que ocupa a mesma posição na 
matriz original e a soma do produto ordenado da linha à pela coluna j (2e matriz), até a linha i— 1. Para 
o elemento (;; o procedimento é análogo (limitado pela coluna j — 1) e dividido pelo elemento diagonal 
na coluna. 


Observações: 


1) Produto ordenado significando: 1º elemento da linha à multiplicado pelo 1º elemento da coluna j, 
20x 2º0,.... 


2) Calculadas todas as linhas e colunas resolve-se o sistema Ux = b', onde U está indicada na 2ə matriz 
e b' é a última coluna da 2: matriz. 


3) Quem não consegue visualizar a maneira prática para montar a 2? matriz deve recorrer às formulas 
(4.7), para resolver o sistema pelo método de Gauss-Compacto. 


4) Dado vários sistemas associados a uma mesma matriz, podemos resolvê-los de uma só vez pelo método 
da Gauss-Compacto. Tais sistemas são chamados de sistemas matriciais. 


Exemplo 4.5 - Usando o Método de Gauss-Compacto resolver o sistema matricial: 


5 2 -1 zı | y 0 | 6 
3 1 4 T3 | Y2 = —7 | T 
1 1 3 z3 | y3 -5 | 4 


Solução: Montamos a matriz, 3 x 5: 


521] 016 5 2 1 |} 0O] 6 
3 1 4| -7| 7| ~{ 35 as 17/5 | -7 | 175 |; 
1 1 3| -5]|4 1/55 -3 13 | -26 | 13 
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onde, obtivemos os elementos da seguinte maneira: 
le linha: (igual a 1º linha da matriz original). Assim: 
u11 = 5, u12 = 2, u13 = 1, u14 = 0, ui =6. 


le coluna: ( igual ao elemento que ocupa a mesma posição na matriz original dividido por aj desde 


que u11 = q11). Assim: 
3 1 
ba = =, fg ==. 
125p BISE 
2º linha: (igual a diferença entre o elemento que ocupa a mesma posição na matriz original e o 
produto da linha 2 pela coluna j , limitado pela linha 1, na 22 matriz, Assim: 


um = 1-8x2 > uz = -Ł, 
us = 4-Bx1 > us = E 
ua = -7-8x0 > uy = -7, 
u2 = 7-8x6 > Ug = Er. 


2º coluna: (igual a diferença entre o elemento que ocupa a mesma posição na matriz original e o 
produto da linha 3 pela coluna 2, limitado pela coluna 1, dividido pelo elemento da diagonal principal 
na 2º matriz). Assim: 


1-1 x2 
b32 = T > bh = —3. 
-5 


3º linha: (igual a diferença entre o elemento que ocupa a mesma posição na matriz original e o 
produto da linha 3 pela coluna j, limitado pela linha 2, na 2? matriz). Assim: 


us = 3-gx1-(-3)x E = ag = 13; 
us = -5-Ex0-(-3x(-7) > us = -2, 
us = 4-;x6-(-3)x E = u = i3 
Assim, resolvendo os sistemas: 
5 2º 1 zı 0 0 
a) —1/5 17/5 T2 = —7 | ; obtemos z = 1 ; 
O 13 T3 —26 —2 
e 
5 2 1 yı 6 1 
b) —1/5 17/5 y2 = 17/5 ; obtemos y = 0 |. 
O) 13 Y3 13 1 
Portanto a solução do sistema matricial: 
521 qa | y 0 | 6 0 | 1 
3 1 4 z2 | y2 = -7 | 7 | é (zly) = 1 | 0 
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Exercícios 
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4.12 - Aplicando-se o método de Gauss-Compacto a um sistema Ax = b, foi obtido o esquema: 


w a |5 3 2 1 = 
6 1 0 3 | 10 De au Sb 5 
ss 7] 2 || 1 5⁄3 -8/3 . 

9 0 ==] 6 we 2 a —63/8 


a) Preencha os espaços pontilhados com valores adequados. 


b) Se x= (x1, £2, £3, £4)* , calcule z3 e z4. 


4.13 - Usando o método de Gauss-Compacto resolver os seguintes sistemas: 


10 X T pg = lg = 10 
(I) zti T 10 tba T lg = 12 
2 zti — E a 10 lg = 11 
4 Ti — 6 Ty = lg = —T 
(II) 2 To ~ 3 To T lg = —5 
zı + 2 ta T lg = 4 


4.14 - Resolver o sistema matricial: 


2 —1 3 £i | yı | 2 —4 | 2 
4 1 2 T2 | Y2 | Z2 = —T | 6 
1 0 10 T3 | Y3 | 28 —11 | 2 


usando o método de Gauss-Compacto. 


4.5 Método de Cholesky 


|5 
| 0 
| —3 
| 


No caso em que a matriz do sistema linear é simétrica podemos simplificar os cálculos da decomposição 
LU significativamente, levando em conta a simetria. Esta é a estratégia do método de Cholesky, o 


qual se baseia no seguinte corolário. 


Corolário 4.1 - Se A é simétrica, positiva definida, então A pode ser decomposta unicamente no produto 


GGt, onde G é matriz triangular inferior com elementos diagonais positivos. 


Prova: A prova é imediata a partir do exercício [4.8] 


Observe que essa decomposição é possível se a matriz A além de simétrica for também positiva definida 


(veja definição [2.4). 


Esquema Prático para a Decomposição GG' 


Do mesmo modo que na da decomposição LU para obtermos a matriz G, aplicamos a definição de produto 


e igualdade de matrizes. Seja então: 


gu O 91 921 Ja 
9212 922 922 932 

GG! = g31 932 933 933 
Jnl Jn2 In3 e.s Jnn O 


gni 
Jn2 
In3 ,e 


Inn 
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Q11 Q12 Q13 ... Qin 
Q21 Q22 Q23 ... Gn 
A = a31 a32 asa sa Agn 
Ant Ana An3 E fi Ann 


Desde que existe uma lei de formação para os elementos diagonais e outra para os não diagonais de 
G, veremos em separado como obter tais fórmulas. 


a) Elementos diagonais de G . 


Os elementos diagonais a;; de A são iguais ao produto da linha i de G pela coluna i de G*. Veja que 
este produto é equivalente a multiplicarmos a linha à de G por ela mesma. Portanto: 


=, 2 
iq = GH 

o 2 2 
a22 = 921 F922, 

PA PAR 2 
Ann = Inifn2 TE sente a Inn 


Logo, os elementos diagonais de G são dados por: 


81 = vai, 
(4.9) 


II 
N 
w 
3 


Sii 


ii NR , 
(ass = E] a) + 


b) Elementos não diagonais de G. 


b.1) 12 coluna : Os elementos da 12 coluna de G, são obtidos igualando-se os elementos da 1e 
coluna de 4 com o produto de cada linha de G pela 1º coluna de G*. Observe que este produto pode 
ser obtido multiplicando-se cada elemento da 1e coluna de G (abaixo da diagonal) pela 12 linha de G . 
Assim: 


@21 = 821 J11, 
ag = Ba J11, 
Ani = Bm J11. 
Qil ; 
> Zi = —, i=2,3,...,n. 
gu 


b.2) 2º coluna: Os elementos da 2: coluna de G, são obtidos igualando-se os elementos da 2: 
coluna de A (abaixo da diagonal principal) com o produto de cada linha de G pela 2e coluna de G*. 
Observe que este produto pode ser obtido multiplicando-se cada linha de G (abaixo da diagonal) pela 2: 
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linha de G. Assim: 


@32 = 931 921 T 832 922; 
Q42 = g4 921 T 842 922, 
an2 = gni J921 + Bna 922 , 
sgam EO II o si 
922 
Se continuarmos calculando 3º, 4º colunas de G, etc ..., teremos a fórmula geral: 
Bi — q 1=2,3,...,n, 
(4.10) 
id o 
Sj = (ass — E Jik gy) [Ij a LEGO 


Utilizadas numa ordem conveniente as fórmulas (4.9) e (4.10) determinam os elementos da matriz G. 
Uma ordem conveniente pode ser: 


91, 921, 931,---, Ini; 922, 9325---> Gn25:--, Inn: 


Isto corresponde a calcularmos os elementos da matriz G por coluna. 


Observações: 


i) Se A satisfaz as condições do método de Cholesky, a aplicação do método requer menos cálculos que 
a decomposição LU. 


ii) O fato de A ser positiva definida garante que na decomposição teremos somente raízes quadradas 
de números positivos. 


iii) O método de Cholesky pode também ser aplicado a matrizes simétricas que não sejam positivas 
definidas desde que trabalhemos com aritmética complexa. Entretanto, só usaremos o método de 
Cholesky se pudermos trabalhar com aritmética real. 


iv) Vimos no caso da decomposição LU, que det(A) = uz u22...Unn, Uma vez que os elementos 
diagonais de L eram unitários. No caso do Método de Cholesky temos que: 4 = GG' e portanto: 


det(A) = (det Gy? = (gn 922 ... Inn) 


Aplicação à Solução de Sistemas Lineares 


Vejamos agora como podemos aplicar a decomposição GG" para obtermos a solução de sistemas 
lineares. 

Seja o sistema Ax = b de ordem n determinado, onde A satisfaz as condições do processo de Cholesky. 
Uma vez calculado a matriz G a solução de Ax = b fica reduzida, como no método da Decomposição LU, 
à solução do par de sistemas triangulares: 


b, 


Gy 


Gtr = y. 
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Exemplo 4.6 - Seja: 


4 2 —4 
A = 2 10 4 
—4 4 9 


a) Verificar se A satisfaz as condições do método de Cholesky. 

b) Decompor A em GG. 

c) Calcular o determinante de A, usando a decomposição obtida . 
d) Resolver o sistema Ax = b, ondeb = (0, 6, 5}. 


Solução: 


a) A matriz A é simétrica. Devemos verificar se é positiva definida. Temos: 


det(A41)=4>0, det(A2)=36>0, det(As) = det(A) = 36 > 0. 


Logo, A satifaz as condições da decomposição GG". 


b) Usando as fórmulas (4.9) e (4.10), obtemos: 
91 = vai 9 v4 g1 =2, 


Q21 2 
gı = + 91 =z gn =1, 
gn 2 
am —4 9 
931 Ja 931 2 931 ; 
1/2 1/2 
922 = (a22 — 951) í > 922 = (10 — 12) : > 92 =ð, 
— 4— (—2)(1 
TES 432 — 931921 Lae ( )( ) => =D 
922 3 
1/2 1/2 
gs3 = (a33 — 931—932) => g33 = (9 -— (—2) — 2°) 
Obtemos então: 
4 2 —4 2 O 2 1 —2 
2 10 4 = 1 3 3 2 
—4 4 9 —2 2 1 () 1 


c) det(A) = (gn 922 933)? =(2x3x 1)? = 36. 


> g3 =l. 
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d) Para obter a solução do sistema Arx = b, devemos resolver dois sistemas triangulares: Gy = b e 


Gtr = y. 
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d.1) Assim de Gy = b, isto é, de: 


2 O yı 0 
1 3 Ya = 6 , 
= 1 Y3 5 


obtemos: 
2 yı = 0 > Yı = 0, 


y + 3y = 6 > y =2 


—2 y + 2y +y =5 > yl. 
Logo a solução do sistema Gy =b é y= (0, 2, 1}. 


d.2) De Gt x = y, isto é, de: 


2 1 -2 £ı 0 
3 2 T2 = 2 , 
O 1 T3 1 
segue que: 
lg = 1, 


3 z2 + 2 z3 = 2 > q2 = 0, 


2x + x —2 r3 = 0 > qı = 1. 


Logo a solução do sistema Gz =y é a(1, 0, 1). 


Assim, a solução de Ag = b, isto é, de: 


4 2 —4 zı 0 1 
2 10 4 T2 = 6 éz = 0 
—4 4 9 T3 5 1 


Exercícios 


4.15 - Aplicando-se o processo de Cholesky à matriz A, obteve-se: 


o piyd aiy 
o Eno 8 10 —8 » t 
-S 3 10 14 -5 EGGEN 
—8 ... 29 
onde: 
1 O 
Di. quai 
Gb o 

0 —4 ... 2 


Preecher os espaços pontilhados com valores adequados. 
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4.16 - Considere as matrizes: 
1 1 0 3 1 0 
A= 1 25 = B= 132 
0 —1 3 0 2 1 


Escolha adequadamente e resolva um dos sistemas Ax = b, Bx = b, pelo processo de Cholesky, onde 
b= (2, 1, 5). 


4.17 - Mostre que: Se o sistema de equações algébricas Ax = b , onde A é matriz não singular, é 
transformado no sistema equivalente Bz = c, com B = AtA; c = Atb, onde At é a transposta de A, 
então o último sistema pode sempre ser resolvido pelo processo de Cholesky (isto é, a matriz B satisfaz 
as condições para a aplicação do método). Aplicar a técnica acima para determinar pelo processo de 
Cholesky, a solução do sistema: 


1 0 1 rı 2 
11 0 r |=[2 
1 1 0 T3 2 


4.6 Método de Eliminação de Gauss com Pivotamento Parcial 


Além dos problemas já citados nesse capítulo para os métodos baseados na decomposição LU, existe 
um outro problema mais sério que está relacionado com a propagação dos erros de truncamento do 
computador. Assim, para ilustrar tal situação, consideremos um exemplo hipotético, (sistema linear de 
ordem 2, com uma máquina que trabalha apenas com 3 dígitos significativos). Tal exemplo servirá para 
ilustrar o que acontece com um sistema de grande porte num computador qualquer, visto que os mesmos 
operam com um número fixo e finito de algarismos significativos. 


Exemplo 4.7 - Através do método de Eliminação de Gauss, resolver o sistema linear: 


1.00 
2.00 


I 


I 


0.0001 zı + 1.00 zə 
1.007) + 1.00 zə 


usando em todas as operações três dígitos significativos. 
Solução: É fácil verificar que a solução desse sistema é: 
ae ( 1.00010 ) | 
0.99990 
Agora, resolvendo o sistema dado, pelo método de Eliminação de Gauss, com 3 dígitos significativos 


em todas as operações, obtemos: 


0.000100 1.00 | 1.00 = ( 0.000100 1.00 | 1.00 
1.00 1.00 | 2.00 o —10000 | —10000 /* 


cuja solução é: 


Portanto, obtemos uma solução muito diferente da solução exata do sistema. 
A propagação de erros ocorre principalmente quando multiplicamos um número muito grande por 
outro que já contém erro de arredondamento. Por exemplo, suponha que um dado número z tenha um 
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erro de arredondamento £; este número pode então ser escrito na forma: Z = z+e. Se agora multiplicamos 
esse número por p, então obtemos pZ = pz + pe e assim o erro no resultado será pe. Assim, se p for um 
número grande esse erro poderá ser muito maior que o original. Dizemos nesse caso que o erro em z foi 
amplificado. 

No método de Eliminação de Gauss vários produtos com os multiplicadores são efetuados. Análises 
de propagação de erros de arredondamento para o algoritmo de Gauss indicam a conveniência de serem 
todos os multiplicadores (as constantes a% / a) do ke passo) menores que 1 em módulo; ou seja o pivô 
deve ser o elemento de maior valor absoluto da coluna, da diagonal (inclusive) para baixo. 

Podemos então em cada passo, escolher na coluna correspondente o elemento de maior valor absoluto, 
da diagonal (inclusive) para baixo, e fazer uma permutação nas equações do sistema, de modo que esse 
elemento venha a ocupar a posição de pivô. A este procedimento chamamos Método de Eliminação 
de Gauss com Pivotamento Parcial. 


Exemplo 4.8 - Resolver o sistema do exemplo anterior pelo método de Eliminação de Gauss com pivo- 
tamento parcial. 


Solução: Devemos colocar na posição do pivô o elemento de maior valor absoluto da primeira coluna. 
Fazendo isso e aplicando o método de Eliminação de Gauss, obtemos: 


1.00 1.00 | 2.00 = / 1.00 1.00 | 2.00 
0.000100 1.00 | 1.00 o 1.00 | 1.00 /* 


e = (1.00 
= aoo j’ 


e portanto bem mais próxima da solução exata. 


cuja solução é: 


A matriz de Hilbert é famosa por produzir um exemplo de sistema linear que se não utilizarmos 
pivotamento a solução obtida pode estar completamente errada. Os elementos de tal matriz são dados 


por: 
1 ; 
hij = TEJI? =; Denan P a 12 ago (4.11) 


Assim a matriz de Hilbert de ordem 4 é dada por: 


1 1/2 1/3 1/4 
1/2 1/3 1/4 1/5 
1/3 1/4 1/5 1/6 
1/4 1/5 1/6 1/7 


Exercício 


4.18 - Considere um sistema linear de ordem 12 que tem a matriz de Hilbert como matriz dos coefici- 
entes e que a solução exata seja o vetor que possui todas as componentes iguais a 1. Resolva o sistema 
usando: 


a) o método de Eliminação de Gauss. 


b) o método de Eliminação de Gauss com pivotamento parcial. 
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Quem resolveu o exercício [4.18] (e quem não resolveu deve fazê-lo), pode observar que a solução obtida 
em b) é melhor que em a). No entanto, se no exercício [4.18] considerarmos um sistema de ordem 17, 
veremos que mesmo o método com pivotamento não produz uma solução satisfatória. O problema é que 
a matriz de Hilbert é uma matriz muito mal condicionada. O problema de condicionamento de matrizes 
será visto mais adiante. 


4.7 Refinamento da Solução 


Como já dissemos anteriormente, os métodos exatos deveriam fornecer, com um número finito de 
operações, a solução exata do sistema linear. Entretanto, devido aos erros de arredondamento obtemos, 
em geral, soluções aproximadas. Veremos aqui como refinar uma solução obtida por processo numérico. 

Consideremos o seguinte sistema linear de ordem n: 


n 
y Qij Tj = bi ; t= E A (4.12) 
j=1 

Sejam z1, 42,..., £n, à solução exata de (4.12) e sejam Z1,Z2>,..., Tn, uma aproximação da solução, 


por exemplo, obtida pelo método de Eliminação de Gauss. Observe que estamos considerando este 
método para poder descrever o processo de refinamento, mas o mesmo é válido para os demais métodos 
apresentados neste capítulo. 
Então, devemos ter: 
ti = Dry; J= 1,2, ash (4.13) 
onde yj, j = 1,2,...,n, são as correções que devem ser adicionadas aos valores z; (obtidos pelo método 


de Eliminação de Gauss), para fornecerem os valores corretos zj. Substituindo (4.13) em (4.12) obtemos: 


n 
Do aa (7; +95) = bj T= Ze 
j=1 


n 
> 3 ayy = bi — X aij Zj ; L= 152, es gT 
j=1 


j=1 
Seja 
Ti = bi— X ai; Tj; 1=1,2,...,n, (4.14) 
j=1 
os resíduos. Obtemos então que: 
Dai; y = rè T= 1,2, ss (4.15) 
j=1 


Observações: 


i) De (4-15), notamos que as correções são obtidas resolvendo-se um sistema linear análogo ao (4.12), 
com mesma matriz dos coeficientes e com o termo independente b;, i = 1,2,...,n, substituído pelos 
resíduos r;, i = 1,2,...,n. Assim na solução de (4.15), devemos refazer apenas os cálculos referentes 
ao novo termo independente. Portanto devemos, ao resolver (4.12), armazenar os multiplicadores 


a k); (k ia 
(ou seja as constantes att) / ai), nas posições supostamente zeradas. 
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ii) A solução de pode também estar afetada de erro, visto que as correções nada mais são do que a 
solução de sistema linear. Assim, encontrado y;, substituimos seus valores em e encontramos 
uma melhor solução aproximada % à qual poderemos novamente aplicar o processo de refinamento. 
Obtemos com isso um processo iterativo, o qual deve ser aplicado até que uma precisão e, pré-fixada, 
seja atingida. 


iii) Para sabermos se a precisão foi atingida devemos calcular o vetor resíduo. Se o mesmo for o vetor 
nulo então teremos encontrado a solução exata. Se o vetor resíduo for diferente do vetor nulo então 
paramos o processo quando: 

[r$ = 18 | 
oo 


| TD oo 


<e (4.16) 


onde ||. Iso está definida no Capítulo 1. 


iv) No cálculo dos resíduos, ou seja, no cálculo de haverá perda de algarismos significativos, por 
serem os valores de b; e E 4 aij Tj aproximadamente iguais. Assim devemos calcular os resíduos 
com precisão maior do que a utilizada nos demais cálculos. Logo, se estivermos trabalhando em 
ponto flutuante devemos calcular os resíduos em precisão dupla. 


v) O processo de refinamento é utilizado, em geral, em sistemas de grande porte, onde o acúmulo de 
erros de arredondamento é maior. 


O exemplo a seguir, mostra o processo de refinamento num caso hipotético, (sistema linear de ordem 
2, com uma máquina que trabalha apenas com dois dígitos significativos). Novamente tal exemplo servirá 
para ilustrar o que acontece com um sistema de grande porte num computador qualquer. 
Exemplo 4.9 - Considere o sistema linear: 


16. 5.0 zı 21. 
3.0 2.5 T2 5.5 

Trabalhando com arredondamento para dois dígitos significativos em todas as operações; 
a) resolva o sistema pelo método de Eliminação de Gauss, 


b) faça uma iteração para refinar a solução obtida em a). 


Solução: Aplicando o método de Eliminação de Gauss ao sistema dado, obtemos: 
16. 5.0 | 21.) 16. 50 | 21. 
3.0 2.5 | 55 0.19| 1.6 | 1.5 ? 


(1) 
a 2 sis E a 
Observe que não calculamos o elemento ap), mas armazenamos nesta posição o multiplicador KED = 


air 


30 = 0.1875 = 0.19, o qual deverá ser usado no cálculo do novo termo independente. Assim, resolvendo 
o sistema: 
16. 5.0 zı o 21. 
0 1.6 T2 1.5 J”? 
obtemos: 
1.5 
— = 0.9375 = 0.94 
na 1.6 
21.— 5.0 x 0.94 21.—4.7 16.3 16. 
x = = = = = 1.0 


16. 16. 16. 16. 
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Portanto, a solução aproximada é: z = (1.0,0.94)*. Agora, desde que r = b-— Az, obtemos: 


o 21. 16. 5.0 1.0 
"= 55/7 (30 16 0.94 j ` 
Fazendo os cálculos, (lembrando que devemos utilizar precisão dupla), obtemos: 


o 21.00 — 16.00 — 4.700 o 0.3000 
= 5.500 — 3.000 — 2.350 = 0.1500 


p 0.30 
= 0.15 
Devemos apenas refazer os cálculos em relação ao novo termo independente, isto é: 
pe 0.30 \ 0.30 
E 0.15 0.15 — 0.30 x 0.19 


dra 0.30 = / 080 
"=> 1015-0057 )7 À 0.093 


Assim, resolvendo o sistema: 


16. 5.0 yı \ (0.30 
0 16 y2 ) 7 \ 0.093 


obtemos: y = (0.00063, 0.058)*. Fazendo, 


Assim, consideramos : 


v=7+y 


= 1.0 E 0.00063 o 1.00063 = 1.0 
E 0.94 0.058 pe 0.998 g LOE 


Calculando novamente o resíduo obtemos que o mesmo é o vetor nulo. Assim x = (1.0,1.0) é a 
solução exata do sistema dado. 


segue que: 


Exercício 


4.19 -Considere o sistema linear: 


Xx1 o: 319 “e 4x3 = —5 
311 Tie 239 AR lg = 8 
211 lr: 4x9 Fe 343 = 4 


a) Resolva-o pelo método de Eliminação de Gauss, trabalhando com arredondamento para dois 
dígitos significativos em todas as operações. 


b) Refine a solução obtida em a). 


4.20 - Considere o sistema linear: 


2x1 E 39 Sr 4x3 = —2 
311 e 239 > lg = 4 
5x1 = 4x5 fm Pê 343 = 8 


a) Resolva-o pelo método de Eliminação de Gauss com pivotamento parcial, trabalhando com 
arredondamento para dois dígitos significativos em todas as operações. 


b) Refine a solução obtida em a). 
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4.8 Mal Condicionamento 


Como vimos, para resolver sistemas lineares dois aspectos devem ser considerados: 
a) se a solução existe ou não. 
b) achar um modo eficiente para resolver as equações. 
Mas existe ainda um aspecto a ser considerado: 
c) se a solução das equações é muito sensível a pequenas mudanças nos coeficientes. 


Este fenômeno é chamado Mal Condicionamento, e está relacionado ao fato de que a matriz dos 
coeficientes nas equações lineares está próxima de ser singular. 

Na seção anterior dissemos que se o vetor resíduo for próximo do vetor nulo então a solução obtida 
está razoavelmente precisa, e isto é verdade para sistemas bem condicionados. Entretanto em alguns 
casos, como mostrado no exemplo a seguir, isto está longe de ser verdadeiro. 


Exemplo 4.10 - Considere o sistema linear: 
1.2969 0.8648 Tı o 0.8642 
0.2161 0.1441 T2 = 0.1440 ) ’ 


e suponha dada a solução aproximada: 
0.9911 
—0.4870 É 


Solução: Calculando o vetor resíduo correspondente a Z, através de (4.14), obtemos: 


o f 10 
r= (1078 


e portanto parece razoável supor que o erro em Z é muito pequeno. Entretanto, pode ser verificado por 
substituição que a solução exata é x = (2, 2)*. No caso deste exemplo é fácil reconhecer o extremo mal 
condicionamento do sistema. De fato, o elemento 


0.2161 
a) = 0.1441 — 0.8648 x [2969 


a 
II 


Calcule o vetor resíduo. 


= 0.1441 — 0.1440999923 ~ 1078. 


Assim uma pequena mudança no elemento 0.1441 resultará numa grande mudança em as) e portanto 


em x», ou seja, mudando 0.1441 para 0.1442 teremos as) = 0.0001000077 com solução 


_ — / —0.00015399 
Ta 0.66646092 ) ` 


Portanto, a menos que os coeficientes em A e b sejam dados com uma precisão melhor do que 1078 é 
perigoso falar sobre uma solução do sistema dado. 

Observe que com este exemplo, não queremos dizer que todas as soluções aproximadas de equações mal 
condicionadas fornecem resíduos pequenos, mas apenas que algumas soluções aproximadas de equações 
mal condicionadas fornecem resíduos bem pequenos. 

Para a análise da pertubação, é conveniente sermos capazes de associar a qualquer vetor ou matriz 
um escalar não negativo que em algum sentido mede suas grandezas. Tais medidas que satisfazem alguns 
axiomas são chamadas normas. ( Revise normas de vetores e normas de matrizes, Capítulo 1). 
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Análise da Pertubação 


Vamos investigar, agora, a condição de um sistema linear não singular Ags = b. Desde que A é não 
singular, a solução do sistema é dada por: x = A-!b. Vamos supor aqui que os dados estão sujeitos a 
certas pertubações e vamos analisar o efeito dessas pertubações na solução. Seja x a solução exata do 
sistema Ag = b. 


1º caso: Consideremos uma pertubação do vetor b da forma b + ôb, e seja A conhecida exatamente. 
Portanto a solução x também será pertubada, isto é, teremos x + dx, e assim de: 


Alx + dx) =b+ ôb. (4.17) 


obtemos: 
(x+ôx) = AHb+ ôb). (4.18) 


A questão que queremos resolver é como relacionar dx com ó6b, ou seja, sabendo o tamanho da 
pertubação em ðb como estimar a pertubação em dx? O procedimento a seguir responde essa pergunta. 


De (4.17), obtemos: 
Ax+ Ade = b+ôb > Adr = ôb, 


desde que Ax = b. Agora desde que A é não singular, segue que: 
ôx = Alb. 
Aplicando norma, em ambos os membros, e usando normas consistentes, obtemos: 
I ôx || < | 46d]. (4.19) 


Do mesmo modo, de Ax = b, obtemos: 


loll <i Alo. (4.20) 
Multiplicando, membro a membro, por (4.20), obtemos: 
| óz ol < AA oa], (4.21) 
ou 
El <gama ol. 


Assim a pertubação relativa em x está relacionada com a pertubação relativa em b pela constante 
multiplicativa || 4 ||| 47! |]. 
Definindo, o número de condição de 4, como: 


cond(A) = || A |I| AI, 


obtemos: 
|| da || 


EA! 


ðb 
ond( A) ma i 


Observações: 
a) Temos que cond(A) > 1. De fato: 


cond(A) = || A || A™ | > | A Aœ | = 7I =1. 
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| ôx || 


dependerá 
Fal P 


b) + pode ser interpretada como uma medida do erro relativo em b. O erro em 
do valor do número de condição que é maior ou igual a 1. 


c) Se cond(A) é grande, então pequenas pertubações relativas em b produzirão grandes pertubações 
relativas em x, e o problema de resolver Ax = b é mal condicionado. 


d) cond(A) será considerado grande quando valer por volta de 104 ou mais. 


2º caso: Consideremos agora uma pertubação da matriz A da forma A + dA e seja b conhecido 
exatamente. Portanto a solução x também será também pertubada, isto é, teremos x + dx, e assim de: 


(A+6A)(x+ôx) = b, (4.22) 


obtemos: 
(x+ôr) = (A+64)b. (4.23) 


Mas, x = A`tb. Portanto: 


ôr = -Ab+(A+ÕA) lb > dr = |(A+68A)! — Ap. 


Seja B = A + ôA. Temos que: 


B} — A™! = A`!AB t! — ABB! = AJ(A-B)B., 


Logo: 
ôr = [A(A-B)B pb = [ATI(A — (A+ ôA))(A + 64)! 


A IGA(A + 64). 


> da 


De (|4.23), segue que: 
ôx = —AIgA(x + ôr). 


Aplicando norma, em ambos os membros, e usando normas consistentes, obtemos: 


ló < IA II ôA Il z+ ôr | 
| öz | m [64] 
> — DN < A A|| = 
Perë $ 14 MA Ta 
| öz | [54] 
> — o < cond(A)-——. 
+06] É “4a 


Novamente, se cond(A) é grande, então pequenas pertubações em 4, produzirão grandes pertubações 
relativas em «x e o problema de resolver Ax = b é mal condicionado. 


Exemplo 4.11 - Analisar o sistema linear: 


1.2969 0.8648 Tı = 0.8642 
0.2161 0.1441 T2 0.1440 i 
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Solução: Temos que : 


ns f 0.1441 —0.8648 
ps o e 1.2969 j ` 


(O cálculo da matriz inversa se encontra na próxima seção). 


Usando norma linha, obtemos: 
Allo = 2-1617, I| A71 |l = 1.5130 x 108, 


e portanto 
cond(A) = || A lool 4! lo = 327065210 = 3.3 x 108, 


mostrando que o sistema é extremamente mal condicionado. 


Se for de interesse estudar métodos que sejam particularmente úteis no caso da matriz A ser mal con- 
dicionada, citamos aqui o método de Kaczmarz, que pode ser encontrado por exemplo em | Carnahan, 
1969]. 


Exercícios 
4.21 - Prove que se uma norma de matrizes é subordinada a uma norma do IR” elas são consistentes. 


4.22 - Sejam A e B matrizes de ordem n. Prove que: 


|B-/=4" | 


| A-B |) 
I| B= | l 


< cond(A) TB] 


4.23 - Analisar o sistema linear Ax = b, onde: 
100 99 
A e ( 99 98 ) Í 


4.24 - Analisar o sistema linear Ax = b, de ordem 17, onde os elementos de A são dados por 3 
isto é, A é a matriz de Hilbert. 


4.9 Cálculo da Matriz Inversa 


Sejam A uma matriz não singular ( det(A) # 0), A! = [bı : bo: ... | bn] a matriz inversa de 4, 
onde b; é a coluna j da matriz A”! e e; a coluna j da matriz identidade. De AAT! = I ; isto é, de: 


A fo AM by] a jaja! a E 
resulta: 
Ab; = ej; j=1,2,...,n. 
Assim podemos calcular as colunas j, j = 1,2,...,n, da matriz A71, resolvendo os sistemas lineares 
acima. 


Portanto, podemos inverter uma matriz utilizando qualquer um dos métodos dados nesse Capítulo. 


Observações: 
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3) 


4) 


144 


Usando decomposição LU obtemos as colunas de A-!, fazendo: 


LUb; = Cia ve 2 tis 
isto é, resolvendo os sistemas: 
L Yi = ĉi 
LL ans ção 
U bi = Yi 


Usando o método de Cholesky (somente para matrizes simétricas e positivas definidas), obtemos as 
colunas de A71, fazendo: 


GG'b; = ei, E Ml ROR E 
isto é, resolvendo os sistemas: 
G yi = e; 
=D os 
Gt bi = Vi 


Usando o método de Eliminação de Gauss, obtemos as colunas de A71, resolvendo os sistemas: 
US Dica 

Observe que podemos colocar todas as colunas da identidade ao lado da matriz À e fazer a decom- 
posição de uma só vez. 


Podemos calcular a inversa de uma matriz, pelo método de Gauss-Compacto usando o mesmo 
esquema da resolução de sistemas matriciais, isto é, fazendo: 


G1 Q12 Gn Til T12 Tin 1 0 0 
a21 Q22 Adm T21 T22 Zon |. 10 1 0 
an1 an2 Ürt Xn1 Ene Da 0 0... 1 


Portanto, as colunas da matriz X são as colunas da matriz inversa de A, desde que AAT! = T. 


Exemplo 4.12 - Considere a matriz: 


3 
A= Re 
1 


NNO 
O. w 


Calcule A! utilizando o Método de Gauss-Compacto. 


Solução: Devemos resolver o sistema matricial: 


3 0 3 zıl Tio T13 1 0 0 
2 21 Lol- Too Log = 0 1 0 
1 2 0 z731 T32 T33 0 0 1 
Temos: 
3 03|100 3 0 3| 1 00 
2 —2 1 |0 1 0 |~ | 2⁄3 -2 -1 | -2/3 1 0 
1 20/001 ds =i ed l = aoi 
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Resolvendo o sistema: 


3 0 3 Taia 1 
—2 -1 T21 = —2/3 , 
O =2 £31 —1 
obtemos: %11 = -ċ4, T21 = b T31 = L, (que é a 1e coluna de 4-1). Do mesmo modo: 
3 0 3 T12 0 
—2 -1 LS = 1 ; 
O —2 T32 1 
PA EE E E AR E Pe . 
ornece £12 = 5, T22 = — J, T32 = —5, (que é a 2: coluna de ), e de: 
3 0 3 £13 0 
—2 —1 T23 E 0 ; 
€) —2 £33 1 
segue que: £13 = r T23 = L £33 = -ż, (que é a 32 coluna de 4-1). Assim: 


—1/6 1/2 1/2 
A! = 1/12 —1/4 1/4 
1/2 —1/2 —1/2 
Exercícios 


4.25 - Usando decomposição LU, inverter a matriz: 


2 1 0 
A = 1 1 1 
1 0 1 
4.26 - Dada a matriz: 
2 1 —1 
A = 1 10 2 : 
-1 2 4 
calcular AT}, utilizando o processo de Cholesky. 
4.27 - Seja 
2 4 
A = 1 -3 -1 
2 1 1 


Usando o método de Eliminação de Gauss, calcule AL. 


4.28 - Usando o método de Gauss-Compacto, calcule AT}, onde: 


2 1 —1 
A = 1 0 2 
4 — 3 
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4.10 Exercícios Complementares 


4.29 - Quais das matrizes: 


2 2 1 3 2 1 2 1 
A=|3 32|; Before To da = A 
Gerd 3 3 2 6 7 


= 
q 


podem ser decompostas na forma LU ? Decompor as que forem possíveis. 
4.30 - Mostre que se A é uma matriz real, simétrica, positiva definida, então necessariamente temos: 
a) an > 0, i= 1,2,...,n. 
b) a2. < aii akk, para todo i £k . 
c) o maior elemento de A em módulo está sob a diagonal. 


4.31 - Considere o sistema Ax = b; onde 


1 a 3 Tı —2 
A=|[a 1 41); z=| zr |; b=| -3 
5 2 1 £3 4 


Para que valores de a: 
i) A matriz A é decomponível no produto LU ? Justifique. 
ii) O sistema pode ser resolvido por Cholesky . Justifique. 
iii) Considere a = 1, e resolva o sistema pelo método de Eliminação de Gauss . 


4.32 - Resolva o sistema abaixo pelo método de Cholesky, completando adequadamente os espaços 
pontilhados. 


2 Li T ser Lo — lg = 3 
Tı T 10 T2 ar ... T3 = 6 
LX + 2 T2 T 4 lg = —6 
4.33 - Para que valores de a e B a matriz: 
4 a 1 
b 41i], 
1 1 1 
se decompõe no produto GG". 
4.34 - Considere os sistemas: 
Ti T 2 to — lg = 4 
(I) 2 s bs e s 13 X92 e i lg = 35 
— 11 ka T2 e 4 T3 = 5 
Tı = 2 T2 Sa T3 = 6 
(II) 2 TI + 4 T2 T Tg = 14 
2 Xo + 2 l2 + lg = 6 


Faça uma escolha adequada para resolver um deles pelo método de Gauss-Compacto e o outro pelo 
método de Cholesky. Justifique sua resposta. 
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4.35 - Resolva o seguinte sistema, por Eliminação de Gauss, usando aritmética complexa. 


Mao + (Q2-)y = 2+i 
(4+6)x + (3-6)y = -2-5i 


4.36 - No exercício anterior escreva x = £r +ixi; Y = Yr + iyi. Multiplique as partes real e imaginária 
de cada equação separadamente. Mostre que o resultado é um sistema de 4 equações a 4 incógnitas, cuja 
solução são as partes real e imaginária do exercício anterior. 


4.37 - Se a decomposição LU de uma matriz simétrica A é dada por: 


1 123 4 
= 2 5] O = 4 8 12 
Ds RO I do O 9 18 5 
432 1 16 
verifique que a matriz G da decomposição Cholesky é dada por: 
1 
Bi O 
fa 3 43 
4 6 6 4 
4.38 - Resolver o sistema matricial: 
1 0 1 zı | n 4| 2 
1 1 0 z3 | y3 9 | 7 
pelo método de Gauss-Compacto. 
4.39 - Calcular us, us, u4, us resolvendo a equação de diferenças: 
un+2 + 4Unyiı +un=n, (x) 
com as condições de contorno u, = 0 e uş = 1, usando um método a sua escolha. (Escreva (x) para 
n = 1,2,3,4). 
4.40 - Aplicando-se o método de Cholesky a uma matriz foi obtido: 
1 2 —i 0 


A = maa S en = GG! onde G = 2 


a) Preencha os espaços pontilhados com valores adequados. 
b) Usando a decomposição GG", calcule a inversa de A. 


4.41 - Seja o sistema Ax = b, dado por: 


10 7 8 21 -3 
75 6 r |=|- 
8 6 10 23 7 


a) Determine a inversa da matriz dos coeficientes pelo método de Eliminação de Gauss. 
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b) Resolva o sistema dado, utilizando a matriz inversa obtida em a). 
c) Determine a solução do sistema usando o método de Gauss-Compacto. 


4.42 Relacione os sistemas lineares: 


3 Loy + 2 lg = 5 
(1) zı + 4 LX N lg = 6 
2 X2 + 5 lg = 7 
—2 É vi a a 2 xo = =] 
(II) LT 3 To 0 — lg = 3 
fe T2 + 2 T3 = 1 
Tı + 2 LI ql T3 = 4 
(III) 2 X1 + 6 T2 = 8 
zı + 4r; = 5 


com os métodos: 
A) Eliminação de Gauss, 
B) Cholesky, 
C) Gauss-Compacto, 


para a sua resolução. 


4.43 - Considere o seguinte conjunto esparso de equações: 


2 —1 rı 2 
Ap. p O za -1 
aga moi T3 7 7 
—1 2s =T TA E 5 

O e O Ts 4 

—1 2 Te 3 


Mostre que usando o método de Eliminação de Gauss o sistema triangular resultante permanece 


esparso. Um sistema como este é chamado TRIDIAGONAL. Tais sistemas aparecem frequentemente 
na solução de equações diferenciais parciais. 


4.44 - Considere o sistema: 


2 5 3 zı 8 
5 2 1 T2 = k 
1 3 6 T3 13 


Trabalhando com arredondamento para dois dígitos significativos em todas as operações: 
a) Resolva o sistema acima pelo método de Eliminação de Gauss com pivotamento parcial. 


b) Faça uma iteração para refinar a solução obtida em a) e então calcule o vetor resíduo. O que 
você pode concluir? 
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4.45 - Dado o sistema Ax = b, considere uma pertubação da matriz A da forma A+ A e seja b 
conhecido exatamente. Prove que: se 


1 E 
AT Is SS BH, 


com B = A + ôA, então: 
ô = 
I| x |< o l+ ôe || 8 =|| ôA |] B <1. 


4.46 - Considere um sistema linear cuja matriz dos coeficientes é dada por: 


e —l1 
A = —1 1 3 
1 1 1 


onde e << 1. 
a) Calcule o número de condição de A. 


b) Com base no resultado do item a) a aplicação do método de Eliminação de Gauss daria bom 
resultado ou seria necessário usar Eliminação de Gauss com pivotamento parcial? 


c) Considere e = 1074, e resolva o sistema linear Ax = b, onde b = (2, 0, 1)t, pelo método 
escolhido no item b). 


4.47 - No Capítulo 3, vimos que o processo iterativo: 


re = Tk (2—a zk), a#0, 


pode ser usado para obter k 
A fórmula acima vale também para refinar a inversa A”! de uma matriz A não singular, isto é: dada 


uma aproximação inicial Xo de AT!, podemos refinar esta aproximação usando: 


Xk+1 = Xk (2 I— A zk), k=0,1,... (xx) 


3.00 1.00 
2.00 2.00 j ` 


Trabalhando com arredondamento para três dígitos significativos em todas as operações; 


Considere a matriz: 


a) obtenha uma aproximação para AT!, usando o método de Eliminação de Gauss, 
p ção p 


b) refine a inversa obtida em a) usando (**), até obter o resíduo R = I — A Xy com norma 
< 01, 


c) usando a inversa obtida em b) calcule a solução aproximada do sistema Ax = b, onde 


b = (—14.0, 12.0}. 


4.48 - Seja A uma matriz não singular de ordem n, e sejam u e v vetores n-dimensionais. 


a) Mostre que, se (A — uv!) 1 existe, então: 


1 
1 vtA-luy ` 


(A-uvy)!= A! +aA uva! coma = 
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b) Dê condições para a existência da inversa (A — uv!) +. 


c) Se A! é conhecida, e B é uma matriz que coincide com A, exceto em uma linha, podemos 
escolher u e v para obter B7! (se existir), aplicando a fórmula dada no item a). Sabendo que: 


12 -4 7 0 —2 -1 
A=| são 1 2 |, At=| -2 1 Abs 
7 =% å -1 4 4 


e que B coincide com A exceto que em vez de 12 temos 5, calcule B71. 


4.11 Problemas Aplicados e Projetos 


4.1 - Considere o circuito a seguir com resistências e baterias tal como indicado; escolhemos arbitrari- 
amente as correntes e os valores da malha: 


20 20 


10V mi) $49 fa) Za 


60 4V 
Figura 4.4 


Aplicando a Lei de Kirchoff que diz que a soma algébrica da diferenças de potencial em qualquer circuito 
fechado é zero, obtemos para as correntes à,ia,i3, o seguinte sistema linear: 


2i + 4(i1—i2) + 2(h-ig)- 10 = 0 
6 is + 2 (i—i) + 2 (i—i) -4 = 0 


Deseja-se determinar o valor de i = (i1, i2, is)! que satisfaça o sistema acima. 
a) É possível resolver o sistema pelo método da decomposição LU? Justifique. 
b) É possível resolver o sistema pelo método de Cholesky? Justifique. 


c) Resolva o sistema pelo método de Eliminação de Gauss. 


4.2 - Representemos por £1, £2,£3 e x4 o número de quatro produtos que podem ser produzidos no 


decorrer de uma semana. Para a produção de cada unidade precisa-se de três tipos diferentes de matéria 
prima A, Be C conforme indicado na Tabela 4.1. 


Tabela 4.1 
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matéria 
prima | À B C 
Produto 
1) E São 
(2) 2 0 1 
(3) 4 2 3 
(4) 3 1 2 


Por exemplo: para produzir uma unidade de (1) precisa-se de 1 unidade de A, 2 de B e 4 de C. Se 
existem disponíveis 30,20 e 40 unidades respectivamente de A, B e C, quantas unidades de cada produto 
podemos produzir? 

Obs: Escreva x1,x2 e x3 em função de x4 e lembre-se que as soluções devem ser inteiras e não 
negativas. 


4.3 - Um cachorro está perdido em um labirinto quadrado de corredores (Figura 4.5). Em cada in- 
terseção escolhe uma direção ao acaso e segue até a interseção seguinte onde escolhe novamente ao 
acaso nova direção e assim por diante. Qual a probabilidade do cachorro, estando na interseção i, sair 
eventualmente pelo lado sul? 


1 2 3 

4 5 6 

7 8 9 
Figura 4.5 


Esclarecimentos: Suponhamos que há exatamente as 9 interseções mostradas na figura. Seja Pı 
a probabilidade do cachorro, que está na interseção 1, sair pelo lado sul. Seja P2, P3,..., Po definidas 
de modo similar. Supondo que em cada interseção a que chegue o cachorro, há tanta possibilidade que 
escolha uma direção como outra, e que, tendo chegado a uma saída, tenha terminado sua caminhada, a 
teoria das probabilidades oferece as seguintes equações para P;: 


P = (0+0+Bb+Py)/4 
Pa = (04 PAPA BA 
PB = (04+B+0+B)/4 
P, = (Poda P+ BA 
Ps = (P+ Pat Ps + Ps)/4 
Ps = (B+P+0+B)/4 
P = (B+04+B+4I)/4 
Ps, = (B+R+PB+1)/4 
DB = (B+PB+0+1)/4 


Para saber a resposta resolva o sistema linear obtido. 
4.4 - O problema de se determinar um polinômio: 


Pala) = ao + a£ + a£? + tran”, 
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de grau no máximo n, tal que : 
b E 
/ gr Pile)de = ki, 1=0,1,...,n, 
a 


onde k; são constantes, pode ser resolvido através da obtenção da solução de um sistema linear. Determine 
um polinômio de grau 3, que satisfaça a condição acima, considerando a = —1, b= 1 e: 


a) ko = ż, Sn, ka= Ê, ha= 5, 
b) ko=2, kı=2, ka= ĝ, k= 38, 
resolvendo o sistema linear resultante por método numérico à sua escolha. 


4.5 - Cargas horizontal e vertical X e Y e um momento M são aplicados à uma estrutura em balanço 
de comprimento L, como mostrado na Figura 4.6. 


à a: e a A 
1 


o EA NA E 
ALASCA A ASA 


Figura 4.6 


Na extremidade livre, o alongamento dx, a deflexão dy e o giro & (igual ao ângulo com a horizontal) são 
relacionados com as cargas, da seguinte maneira: 


L 
Ea 0 0 
É X ÔT 
L? r 
0 JEI ZEI yl = Ial, 
r? L 
É JEI FI M. $ 


onde: 
e E é o módulo de Young 
e A éa àrea de secção transversal 
e I é o momento de inércia 
A matriz do sistema acima é positiva definida e é chamada matriz de flexibilidade da estrutura. 


a) Obter a inversa da matriz de flexibilidade correspondente aos seguintes dados: 
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e E = 200 + 
e A = 400 cm? 
e L=30m 


e I = 50000 cmt 
b) Usando o resultado obtido em a) calcular as cargas X e Y e o momento M correspondentes 
a: 
e ôx = 0.0035 cm 
e ôy = 3.0 cm 
e ġ = 0.018 


4.6 - Considere o circuito em escada, mostrado na Figura 4.7, composto de resistores concentrados e 
fontes de tensão ideais, uma independente e outra controlada. 


Kei 


i 
100V O 


D É 


O sistema de equações que se obtém ao solucionar o circuito pelo método dos laços é o seguinte: 


Figura 4.7 


4 (I +2+ 1) +10 6 = 100 
4(h+b+1)+3 (Db + Ts) +10 Is =100-2 1, 
4(h+b+1)+3 (2 +I) +9 1, = 100 -2 1, 


a) Escreva o sistema acima na forma Ax = b. 
b) Determine Ar. 


c) Usando o resultado obtido em b) determine o valor de LI. 


4.7 - Suponha que tenhamos o circuito dado na Figura 4.8. 


A so (1) 19 (2) 


100V O 


B 50 (4) 20 (3) 


Figura 4.8 
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A corrente que flui do nó p para o nó q de uma rede elétrica é dada por: 
-va 


Toa Ra 


onde I em Ampéres, R em Ohms e Vp e Va são voltagens nos nós p e q, respectivamente, e Rpg é a 
resistência no arco pq (Lei de Ohm). 

A soma das correntes que chegam a cada nó é nula (Lei de Kirchoff); assim, as equações que relaci- 
onam as voltagens podem ser obtidas. Por exemplo: no nó 1, tem-se a equação : 


Ja + z1 + Is = 0, 


ou seja, 
100 — V Vo — V Va — V 
1 1 1 0 


2 1 2 


ou ainda 


4V, + 2Vo + V4 = —100. 


Obtenha as demais equações do sistema linear e resolva-o. 


4.8 - Uma transportadora possui 5 tipos de caminhões que representaremos por (1), (2), (3), (4), (5), 
os quais são equipados para transportar 5 tipos diferentes de máquinas A, B, C, D, E segundo a Tabela 
4.2, onde supomos que À, B, C, D, E é a quantidade de máquinas que cada caminhão pode transportar 
levando carga plena. 


Tabela 4.2 
Máquinas | A B C D E 
Caminhões 

(1) 1 1 1 0 2 
(2) 0 1 2 1 1 
(3) 2 1 1 2 0 
(4) 3 2 1 2 1 
(5) 2 1 2 3. 1 


Assim, o caminhão (1) pode transportar 1 máquina A, 1 máquina B, 1 máquina C, nenhuma máquina 
D, 2 máquina E, etc. Quantos caminhões de cada tipo devemos enviar para transportar exatamente: 


e 27 máquinas do tipo À 
e 25 máquinas do tipo B 
e 31 máquinas do tipo C 
e 31 máquinas do tipo D 
e 22 máquinas do tipo E 


Supondo que cada caminhão vai com carga plena, resolva o sistema linear obtido. 


Sugestão: Represente por t1,%2,%3,%4 e zg o número de caminhões respectivamente dos tipos (1), 


(2), (3), (4) e (5). 
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4.9 - Elabore um algoritmo que tendo como dados n, a matriz A(nx n) onde A = (a;;) é tal que aij = 0 
para |i — j| > 1, eb é um vetor (n x 1), determina a solução do sistema linear Ax = b pelo método de 
Eliminação de Gauss adaptado para sistemas tridiagonais. 


a) Teste seu algoritmo para resolver o sistema dado por: 


—Yk-1 + 2Yk — Yk+1 = ( k=1,2,...,n, 


n+ 1)? 


para vários valores de n, e compare sua solução com a solução matemática: 
2 
k k 
n+1 n+1 


Considere n = 10 en = 20 e tome em ambos os casos yo = Yn+1 = 0. 


yr =4 


b) Teste seu algoritmo para resolver o sistema Ax = b, onde: 


4 —2 
—1 2 —1 O) 
—1 2 —1 
—1 2 —1 
—1 2 —1 
AS =E pes ans 
—1 2 —1 
—1 2 —1 

© —1 2 —1 

—2 4 
b= (2, —1, 7, 5, 4, 3, 2, —4, 7, 8). 

4.10 - Representemos por xi, i = 1,2,...,n o número das unidades de n produtos que podem ser 
produzidos no decorrer de uma semana. Para produção de cada unidade precisa-se de m tipos diferentes 
de matéria prima Mı, M2,..., Mm. Tais relações são dadas através de uma matriz A onde aij indica 
quantas unidades da matéria prima M; são necessárias para produzir uma unidade do produto xi. 

Suponha que existam Di, D2,..., Dm unidades respectivamente de matérias primas Mı, Mə, ..., Mm. 


Nosso problema é determinar quantas unidades de cada produto podemos produzir. 
Lembre-se que tais quantidades devem ser inteiras e não negativas. 
Considere os dados da Tabela 4.3. 


Tabela 4.1 

Mı Mə M3 Mı Ms Me 
T 7 2 7 2 7 5 
T2 2 0 1 4 2 2 
Ta 4 2 3 1 5 3 
£4 3 1 2 o; 2 2 
Ts 1 2 0 3 1 2 
£e 1 0 1 0 4 3 
£7 5 3 2 2 3 2 
D 60 70 70 50 70 60 


Capítulo 5 


Solução de Sistemas Lineares: 
Métodos Iterativos 


5.1 Introdução 


Ao lado dos métodos exatos para resolver sistemas lineares, existem os métodos iterativos os quais 
passamos a discutir agora. Em certos casos, tais métodos são melhores do que os exatos, por exemplo, 
quando a matriz dos coeficientes é uma matriz esparsa (muitos elementos iguais a zero). Eles ainda 
são mais econômicos no sentido que utilizam menos memória do computador. Além disso, possuem a 
vantagem de se auto corrigir se um erro é cometido, e eles podem ser usados para reduzir os erros de 
arredondamento na solução obtida por métodos exatos, como discutido no Capítulo 4. Podem também 
sob certas condições ser aplicado para resolver um conjunto de equações não lineares. 


5.2 Processos Estacionários. 


Um método é iterativo quando fornece uma sequência de aproximantes da solução, cada uma das 
quais obtida das anteriores pela repetição do mesmo tipo de processo. 

Um método iterativo é estacionário se cada aproximante é obtido do anterior sempre pelo mesmo 
processo. 

Quando os processos variam de passo para passo mas se repetem ciclicamente de s em s passos dizemos 
que o processo é s-cíclico. Agrupando-se os s passos de cada ciclo num único passo composto, obtemos 
um método estacionário. 

No caso de métodos iterativos precisamos sempre saber se a sequência que estamos obtendo está 
convergindo ou não para a solução desejada. Além disso, precisamos sempre ter em mente o significado 
de convergência. ( Revise: norma de vetor e norma de matriz , Capítulo 1). 


Definição 5.1 - Dados uma sequência de vetores vt) € E e uma norma sobre E, onde E é um espaço 
vetorial, dizemos que a sequência {£} converge para x € E se [at — x || > 0, quando k > oœ. 


Consideremos então um sistema linear Az = b determinado, (det(A) £ 0), onde A é uma matriz 
quadrada de ordem n, x e b são vetores n x 1. 

Como no caso de equações não lineares (Capítulo 3), para determinar a solução de um sistema linear 
por métodos iterativos, precisamos transformar o sistema dado em um outro sistema onde possa ser 
definido um processo iterativo; e mais, que a solução obtida para o sistema transformado seja também 
solução do sistema original, isto é, os sistemas lineares devem ser equivalentes. 
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Suponha então, que o sistema Ax = b tenha sido transformado num sistema equivalente da forma: 
q = Bz +g. (5.1) 


( por exemplo: B=I—A e g= b), de maneira que a solução Z de (5.1) seja, também, solução de 
Az =b. 

Seja x(º) uma aproximação inicial para a solução Z de (5.1). Obtemos as aproximações sucessivas x¥) 
para a solução desejada z7, usando o processo iterativo estacionário definido por: 


r™® = B® 4g. (5.2) 


Se a sequência {x(*)} converge para Z então Z coincide com a solução x de Ax = b. 
De fato, passando-se ao limite ambos os membros de (5.2), obtêm-se: 


z=BĒ3 +g. 
Pela hipótese de equivalência z é também solução de Ax = b. 


O próximo teorema fornece a condição necessária e suficiente para a convergência da sequência a(”. 


Teorema 5.1 - A condição necessária e suficiente para a convergência do processo iterativo definido 
por (5.2) é que maz|A;| < 1, onde A; são os auto-valores da matriz B. 


Prova: A prova deste teorema pode ser encontrada em ..... 


Em geral é difícil verificar as condições do teorema [5.1] Entretanto, podemos obter uma condição 
suficiente que a matriz B deve satisfazer para assegurar a convergência do processo iterativo definido 
por (5.2). Enunciamos formalmente tal condição no próximo corolário. 


Corolário 5.1 - (Critério Geral de convergência)- O processo iterativo definido por é conver- 
gente se para qualquer norma de matrizes, | B||<1. 


Prova: A convergência da sequência x(*) para a solução x de Ar = b é estudada introduzindo-se o vetor 
erro: 


e) = q — q. 


Subtraindo-se membro a membro de (5.1), obtemos: 


e portanto: 
e = gi) (5.3) 
De (5.3) podemos escrever: 
ED = BD > e% = Br, 


e assim por aplicações sucessivas, segue que: 


et) = BE e, 
onde e(?) é o erro inicial. Tomando normas consistentes, (definição ), na expressão acima, segue que: 


IB* O |<pBIft pe. 
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Portanto: 
Ie || < B 1*1 e® | 


Desta desigualdade vemos que se || B ||< 1 teremos: 
Ie j=j a 


isto é, se || B ||< 1 para alguma norma, então temos garantida a convergência do processo iterativo 
definido por (5.2). 
A matriz B de (5.2) é chamada matriz de iteração do processo iterativo. 


Exemplo 5.1 - Seja 


0.5 —0.2 0.5 
B = 0.1 0.6 0.4 
—0.3 0.1 0.0 


Verificar se um sistema Ax = b que tenha a matriz B acima, como matriz de iteração, convergirá 
para a solução. 


Solução: Calculando || B || obtemos || B || = 1.2 e nada podemos concluir. Calculando || B || obte- 
mos || B ||ı= 0.9 < 1 e podemos agora afirmar que o processo iterativo com essa matriz é convergente. 


Processo de Parada 


Para aplicar qualquer método iterativo escolhemos x(?) como uma aproximação inicial para a solução 
de Ax = b. Com essa aproximação inicial e um método numérico, do tipo (5.2), refinamos a solução até 
obtê-la com uma determinada precisão (número de casas decimais corretas) . 

Para obtermos a solução com uma determinada precisão e devemos, durante o processo iterativo, 
efetuar o seguinte teste: Se 


E 


| æT Ilao 


< e (errorelativo) , 


onde € é uma precisão pré-fixada; xë e gtt! 


é a solução procurada, isto é, tomamos x = x 
Veremos agora alguns métodos particulares. 


são duas aproximações consecutivas para 7, então «+ 


k+1 


5.2.1 Método de Jacobi-Richardson 


Considere o sistema linear Ax = b de ordem n, determinado, isto é: 


ATI + GQiala | Gintan = bı 
a21%1 + Goal | GonYn = by (5 4) 
Ani£ı + an2ão ai a Annin = ba 


A matriz A do sistema (5.4) pode ser decomposta na forma: 
A=L+D+R, 


onde L é uma matriz triangular inferior formada pela parte inferior da matriz A, D é a diagonal de A e 
R é uma matriz triangular superior formada pela parte superior da matriz A, isto é: 


p, = J “i” i>i g= MD cg a J ASS 
To opier T Liata] TA LU aia] 
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Supondo det(D) # 0, podemos transformar o sistema original em: 


L+D+RZ=b 
> Dr =-(L+R)z+b 
>x = -D (L+ R)z+ Db. 


que está na forma com B = —-D7!(L + R) e g = Db. 
O processo iterativo definido por: 


t+) = -DHL + R) z™® + D! b, (5.5) 


é chamado de Método de Jacobi-Richardson. 

Comparando com vemos que a matriz de iteração do método de Jacobi-Richardson é : 
-D-!(L + R). 

Por hipótese a;; # 0, pois estamos supondo det(D) £ 0. Podemos então, antes de decompor a matriz 
A em L + D + R, dividir cada equação pelo correspondente elemento da diagonal principal, resultando 
assim: 

A* = L*+I+ Rž, 

onde A* é a matriz obtida de A após a divisão, 1 é a matriz identidade. 

Assim, o processo iterativo pode ser escrito como: 


onde os elementos de L*, R* e b* são, respectivamente, dados por: 


* a: Qij r 4 $ o Qij r E 
=) 0% = q 2) y yod u = mo TS 
7 0 ; i<j ? 0 a) 
bi 
b% =z i=1,2, sn 
NA 


Vemos por que as componentes de x*+! podem ser calculadas sucessivamente sem necessidade 
de se calcular D”*, e a matriz de iteração do método de Jacobi-Richardson é dada por: — (L* + Rº). 


Dado o sistema (5.4), o método de Jacobi-Richardson consiste na determinação de uma sequência de 
aproximantes da iteração k: 


af ; ao dedica af) » bi 1,2 Denis 
a partir de valores iniciais: 
(0) (0) 0 
2i yi pg O, 
através do processo iterativo definido por (5.6), isto é: 

k s (kb x (k k $ 
mo = — ajang = ajax” = prg = ainn) + bi 
as Re az xt” — absrç) > pus — ani + b3 
af) = — az xt” — al =... — as, 26) + b 
(k41) k k (k) 
O acap m a aa E 


Observe que o método de iteração linear para uma única equação, que foi discutido no Capítulo 3, 
e o método de Jacobi-Richardson são exatamente o mesmo, com a diferença que este último é aplicado 
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a um sistema de equações. E fácil ver que no método de Jacobi-Richardson as equações são mudadas 
simultaneamente usando-se o valor mais recente do vetor x, e por causa disso esse método é também 
conhecido por Método dos Deslocamentos Simultâneos. 


Critérios de Convergência 


Fazendo B = —(L* + R*) no critério geral de convergência, (Lema 5.1) e escolhendo sucessivamente as 
normas || - Il e || - || obtemos critérios suficientes de convergência para o método de Jacobi-Richardson. 


Assim o método de Jacobi-Richardson converge se: 


a) o critério das linhas for satisfeito, isto é, se: 


Observe que basta apenas um dos critérios ser satisfeito para garantirmos a convergência. 


Definição 5.2 - Uma matriz A é estritamente diagonalmente dominante se: 


5 |a;zl < laiil , 1=1,2,...,n. (5.9) 
a 


Observação: 


Com a definição fica fácil ver que se a matriz dos coeficientes for estritamente diagonalmente 
dominante então o critério das linhas é satisfeito. De fato, se (5.9) é satisfeita para todo i, então se 
dividimos cada equação pelo correspondente elemento da diagonal principal segue que: 


n u — 
a: ; ; X 
X = <1li=1,...,n> ) SA gi la| <1. 
j=1 Ia = 
jži If g 


Portanto obtemos mais um critério de convergência, isto é, podemos verificar se o método de jacobi- 
Richardson converge testando se a matriz dos coeficientes é estritamente diagonalmente dominante. 


Exemplo 5.2 - Resolver o sistema: 


10x1 —+ 2x9 b gg T3 = T 
Tı T 5x2 T T3 = —8 
2x1 ar 319 a 10x3 = 6 


pelo método de Jacobi-Richardson com x®) = (0.7, —1.6,0.6)t e e < 107?. 
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Solução: Em primeiro lugar devemos testar se temos garantia de convergência. Temos que a matriz dos 
coeficientes é estritamente diagonalmente dominante, pois satisfaz (5.9). De fato: 


la2] + [043] 
la21 + [a23] 
la31) + [a32] 


1+1] < J10] = 
= i+] < =| 
= pl+I| < po = 


|ja11l] , 
a22| , 


|a33| ê 


Portanto podemos garantir que o processo de Jacobi-Richardson aplicado ao sistema dado será con- 


vergente. 


Dividindo então cada equação pelo correspondente elemento da diagonal principal obtemos: 


Tı 
0.271 


0.2x1 


0.2x3 “Ir O.lxs = 
T2 E 0.2x3 = 
0.3x5 “e T3 = 


0.7 
—1.6 
0.6 


Apesar de não ser necessário, pois já sabemos que o processo de Jacobi-Richardson será convergente, 
por se tratar de exemplo, verificaremos também o critério das linhas e o critério das colunas. Assim, para 


verificar o critério das linhas, calculamos: 


= 0.3, 


0.2, 


À 


laio] + ais] = [0.2] + |0.1] 

a] + |a35] = [0.1] +]0.1] = 

laži] + |a3o = |0.2| +10.3] = 0.5, 
3 

> max, x 85) = 0.5 < 1 


j=1 
IP 


e portanto o critério das linhas é válido, o que já era de se esperar, (ver observação após definição |5.2). 
Para verificar o critério das colunas, calculamos: 


|a3ı| + 


[EP 


[ara À 


max 
1<j<n 


jaz] = 10.2] + 0.2] = 
- lažə| = 10.21 + |0.3] = 
E lažs| = 10.1] + |0.2] = 


3 
XO Jọ] = 0.5 < 1, 
i=1 


1%) 


portanto o critério das colunas também é válido. 
Portanto qualquer um dos critérios de convergência assegura a convergência do método de Jacobi- 
Richardson. Temos que as iterações são definidas por: 


rft» o 
git+) 


(k ) 
+1 
T3 


e a partir de at) = (0.7, 


zf” -= -0.20 — 0.104 
24) —0.20/) — 0.20 
ao? 0,229” — 0,329 


-0.22 0s + 
—0.2z 0.220 
0.220 = 0.304 + 


04, 
05, 
0.3, 


0.7 
1.6 
0.6 


) 
) 
Ja 


0.7 = 


0.2(—1.6) 


Continuando as iterações obtemos a tabela: 


0.1 (0.6) - 
— 1.6 = —0.2(0.7) — 0.2(0.6) — 1.6 = —1.86 
0.6 = —0.2(0.6) — 0.3(—1.6) 4 


—1.6,0.6)*, obtemos para xz) os seguintes valores: 


+ 0.7 = 0.96 


- 0.6 = 0.94 


CAPÍTULO 5. SOLUÇÃO DE SISTEMAS LINEARES: MÉTODOS ITERATIVOS 


k 0 1 2 3 4 
zı | 0.7 0.96 0.978 0.9994 0.9979 


xo | -1.6 -1.86 -1.98 -1.9888 -1.9996 


z3 | 0.6 0.94 0.966 0.9984 0.9968 


Agora, desde que: 
—0.0015 
rO — q) = 0.0108 |, 
0.0016 


e portanto 
| z® — z® llo 0.0108 = 
= = 0.0054 < 1072, 
|| 2 Ilo 1.9996 


segue que a solução do sistema, com e < 1072, é: 


Exercícios 


5.1 - Usando o método de Jacobi-Richardson, obter a solução do sistema: 


10x, + £ — z3 = 10 
Tı T 10x Ir T3 = 12 
2x1 = T2 T 1023 = 11 
com 3 casas decimais corretas. 
5.2 - Dado o sistema: 
10x1 epe T2 = T3 = 10 
2x1 T 10x2 ES 8T3 = 20 
Txi -s L2 l og 10x3 = 30 


a) Verificar a possiblidade de aplicação do método de Jacobi-Richardson. 


b) Se possível resolvê-lo pelo método do item a), obtendo o resultado com e < 1072. 


5.2.2 Método de Gauss-Seidel. 


162 


Suponhamos, como foi feito para o método de Jacobi-Richardson, que o sistema linear Ax = b seja 


escrito na forma: 
(L* +I + R*)je=0*. 


Transformamos então esse sistema como se segue: 


que está na forma com B = —(L* + IJ} R* e g = (L* + DT '*. 
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O processo iterativo definido por: 
EHD) = (t+ DRA (L* +D) , (5.10) 


é chamado de Método de Gauss-Seidel. 
Comparando (5.10) com (5.2) vemos que a matriz de iteração do método de Gauss-Seidel é: —(L* + 
DR. 
Observe que pré-multiplicando (5.10) por (L* + I) , segue que: 
(L* + DetD = Reqt) +0" 


ou 
gt!) = Lg) — prq) br, (5.11) 
Por (5.11) vemos que as componentes de z*+1) podem ser calculadas sucessivamente sem necessidade 
de se calcular (L* + 1). 
Dado o sistema (5.4), o método de Gauss-Seidel consiste na determinação de uma sequência de 
aproximantes da iteração k: 


rP a, 20 h=1,2,3,..., 
a partir de valores iniciais: 
zO s9 aa z0 i 
através do processo iterativo definido por (5.11), isto é: 
gft» = — at? — ate? — ... — at, Di) + bj 
at) = — ax 2 — ažgr® — ua — as, tb + b 
k k x (k k % 
ma — 03404 = dai m TE i + b 
k k k k 
ae = aaa ÃO is A DA 


Esse método difere do processo de Jacobi-Richardson por utilizar para o cálculo de uma componente 
de z(*+!) o valor mais recente das demais componentes. Por esse motivo o método da Gauss-Seidel 
também é conhecido por Método dos Deslocamentos Sucessivos. 


Critérios de Convergência 


Fazendo B = —(L*+1) 1! R* no critério geral de convergência, (Lema 5.1), vamos agora obter critérios 
de convergência para o método de Gauss-Seidel. 

Inicialmente lembremos, (veja definição [1.13), que se k satisfizer a desiguladade || Br |< k || «x || 
teremos || B |< k. Impondo k < 1 teremos uma condição suficiente para garantir a convergência do 
método de Gauss-Seidel. Vejamos então como obter tal condição. Para tanto, seja y = Ba, isto é: 


y = —(L* +I)! Rg 
> (L*+DI)y = — Rx 


Assim o vetor y é obtido do vetor x a partir das equações: 


* 
yı =— ajs t2 — j3 T3 — ... — dy Tr 
* * * 
ba = — Q21 Y1 — dog T3 — ... — A2n Tn 
— * * * 
Y3 = — Gg Yı — Q32 Y2 — ... — Un En (5.12) 


= * * * 
Yn = — Anı Y1 — An2 Y2 —.— Arno Yn-1 
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e queremos calcular || Bæ lo. Mas, 


| Be lo = ly lo, com |y llo = max irl- 


Agora, a partir de (5.12), podemos escrever: 


n n n 
nb = DS ax <> lol <>, lai] max |æ; 
j=2 j=2 j=2 E 


n n 
= olá lelo=G ro ode A = J la. 
j=2 


j=2 
Portanto: 
luil < Br elo 
n n 
ll = làin + $O ay zl < lilu + $O laž; lezl 
j=3 j=3 
n 
< lol Ixl + >; las, max [| 
j=3 
< laal lalo + 5 laz;l | 2 lloo 
j=3 
n 
= [lol + > l03;) lello = £2 llelo 
j=3 
n 
onde fa = | |axlB + 5 |a3;| 
j=3 
Portanto: 


ləl < Bo elo - 


Assim, para yi, podemos escrever: 


[yil = 3 aij Yj o 3 aij z| < 3 lai;| lyzl + 5 lai;| EZ 


j=i+1 j=i+1 
i— 
< 5 la dij| Bi; | T Ilo + a [ais] max |x;| 
j=1 j=i+1 
i—1 n 
< AD lá + > ll) elos £ Ie llo 
j=1 j=j+1 


onde ĝ; = 2 lai;| B; + E [e 


j=i41 
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Portanto: 
luil < Bi lxllo - 


Temos então: 


2 = | < 
[Belo = Iylo= max ul < max A le læ 
< ie 
> [Blo< mx A 


Assim se 8; < 1 teremos || B |lw< 1 e portanto estará satisfeita uma condição suficiente de con- 
vergência. 
Portanto o método de Gauss-Seidel converge se: 


a) o critério de Sassenfeld for satisfeito, isto é, se: 


max 5; < 1 
I<i<n Pi 


onde os 3; são calculados por recorrência através de: 


n 


i—1 
B=> llb + 53 la. (5.13) 
j=1 j=i+1 

b) o critério das linhas for satisfeito, isto é, se for verificado. 


Para provar que o critério das linhas é válido também para o método de Gauss-Seidel, basta verificar 
que a condição (5.7) implica 6; < 1 ,i = 1,2,...,n. De fato, (provando por indução), para i = 1, 
temos: 


n 
b = 2 lai; < an 2 lai;;] < 1. 
J= 


Suponhamos 3; < 1 para j =1,2,...,i— 1. Segue então: 


i—l n 
Bi = Silas; 6; + 5 Jai; 
j=1 j=i+1 


IA 
M 
2, 
IA 
AB 
AR 
há 
By 
n 
E 


Portanto max 8; < 1 e o critério de Sassenfeld é verificado. 


c) a matriz dos coeficientes for estritamente diagonalmente dominante, isto é, se (5.9) for válido. 
A prova aqui é idêntica à realizada no método de Jacobi-Richardson. 


Observações: 


1. Dado um sistema linear Ax = b pode acontecer que o método de Jacobi-Richardson aplicado a ele 
resulte convergente enquanto que o de Gauss-Seidel resulte divergente e vice-versa. 


2. Se || B || não for apreciavelmente menor que 1 a convergência pode ser bastante lenta. 
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3. Uma permutação conveniente das linhas ou colunas de A antes de dividir cada equação pelo coefi- 
ciente da diagonal principal pode reduzir o valor de || B ||. 


4. A convergência para os métodos: Jacobi-Richardson e Gauss-Seidel não depende do vetor inicial 
(0) 
g, 


Evidentemente quanto melhor a aproximação inicial menor será o número de iterações necessárias 
para atingir uma determinada precisão. Como não conhecemos a priori a solução, normalmente, 
tomamos o vetor nulo como sendo o vetor inicial. Observe que para o método de Jacobi-Richardson, 
se tomarmos o vetor nulo teremos x) = b*. Tomamos então x!” = q (vetor nulo), para o método 
de Gauss-Seidel e z" = b*, para o método de Jacobi-Richardson. 


Exemplo 5.3 - Resolver o sistema: 


5x1 T Lo T T3 E 
3x1 T 4x, e T3 = 6 
3x1 “Ir 3x2 Ea 6x3 = 0 


pelo método de Gauss-Seidel com e < 1072. 


Solução: A matriz dos coeficientes não é estritamente diagonalmente dominante. Assim, por esse critério, 
nada podemos afirmar sobre a convergência do processo de Gauss-Seidel. 
Dividindo cada equação pelo correspondente elemento da diagonal principal obtemos: 


lj + 0.2£2 + 0.2x3 =>... 
0.75%1 Site Lg T 0.253 = 1.5 
0.5x1 = 0.525 he T3 = 0 


Vimos anteriormente que se matriz dos coeficientes não for estritamente diagonalmente dominante 
então o critério das linhas também não será satisfeito. Mas, por se tratar de exemplo, calculemos (5.7). 
Assim: 


laio + lara] = [0.2/+ 10.2] = 04, 
la3ı| + la33| = [0.75] + 10.25] = 1, 
la3ı| + la3a| = 10.5] + [0.5] = 1, 


3 
= max J lai] = 1 
I<i<n 
jo 
Via! 


e portanto por esse critério não podemos garantir convergência. 
Aplicando o critério de Sassenfeld, temos: 


© 
| 


0.2] + |02] = 04, 
Bo = |0.75/(0.4) + |0.25] = 0.3 + 0.25 = 0.55, 
[0.5/(0.4) + |0.5/(0.55) = 0.2 + 0.275 = 0.475, 


DB 
q 
Il 


> max 9; = 0.55<1, 
1<i< 


logo temos o critério de Sassenfeld satisfeito e portanto podemos garantir que o processo de Gauss-Seidel 
converge . 
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Temos que as iterações são definidas por: 


DD = 022P — 0241 
OD = 0.75 ft) — 0.25s + 15 
E a 
e a partir de a) = (0,0,0)*, obtemos para x) os seguintes valores: 
zP = 02 o +1 = —0.2(0) — 0.2(0)+1 = 1 
Do = 0.75 — 0.250 +1.5 = —0.75(1) — 0.25(0) + 1.5 = 0.75 
zP = —0.5z® — 052 = —0.5(1) — 0.5(0.75) = —0.875 
Continuando as iterações obtemos a tabela: 
k [0 1 2 3 4 
zı 0 1 1.025 1.0075 1.0016 


x2 |0 0.75 0.95 0.9913 0.9987 


x3 | 0 -0.875 -0.9875 -0.9994 - 1.0002 


Agora, desde que: 
—0.0057 
r” -z = 0.0074 |, 
0.00075 


e portanto 


(8 — z6] Ilo 0.0074 
[E ela = 0.0074 < 1072, 


|| xD Il 1.0016 
segue que a solução do sistema, com e < 1072, é: 
1.0016 
Lo 0.9987 
—1.0002 
Exercícios 
5.3 - Dado o sistema: 
4274 Tr 239 ERES 6x3 = 1 
4274 Eu T2 ER 343 =. 2 
—-7 + 5% + 313 = 3 


Mostrar que reoordenando as equações e incógnitas podemos fazer com que o critério de Sassenfeld 
seja satisfeito, mas não o das linhas. 


5.4 - Considere o sistema: 


5x1 —+ 219 = T3 = 7 
=i e a 4x, EE 2x3 = 3 
2x1 = 3x2 F 10x3 = —1 


a) Verificar a possiblidade de aplicação do método de Gauss-Seidel, usando o critério de Sassen- 
feld. 


b) Se possível, resolvê-lo pelo método do item a), obtendo o resultado com e < 1072. 
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5.3 Processos de Relaxação 


Veremos nessa seção alguns métodos iterativos para resolver sistemas lineares conhecidos como pro- 
cessos de relaxação. Para desenvolver tais métodos precisamos de alguns conceitos, os quais passamos 
a considerar agora. 


1) Para uma função y = f(x), o ponto zo tal que f'(x9) = 0 é denominado ponto estacionário de 
f. Para saber o tipo de ponto calculamos a derivada segunda de f. Assim se: 
a) f"(xo > 0 então zo é ponto de mínimo, 
b) f"(x0) < O então xo é ponto de máximo, 


c) f“(x09) = 0 então zo é ponto de inflexão. 


2) Para uma função de n variáveis y = f(£1,£2,..., n), denominamos gradiente de f, em símbolo, 
grad f,: 
grad f = FERE” e RE ) 
onde f+; são as derivadas parciais de f em relação a x;. Assim o ponto P = (x14,...,%n)' tal que 
grad f(P) = 0 é denominado ponto estacionário de f. 
Portanto ponto estacionário é o ponto onde todas as derivadas parciais se anulam. 
Para saber o tipo de ponto, devemos calcular as derivadas parciais de 22 ordem. Seja A uma matriz 


2 
cujos elementos (a;;) = TEM Portanto: 
10% 


o2f af af 
dz; dridro  Oxdrn 
of af Pf 
A(P) = dx20%1 das “e doom 
af af of 
dxndry Lpz ` Ox? 


n 
Assim, se: 
a) A(P): positiva definida então P é ponto de mínimo, 
b) A(P) : negativa definida então P é ponto de máximo, 


c) A(P): indefinida então P é ponto de cela. 


A definição de matriz positiva definida encontra-se no Capítulo 4 (Definição [4.4). 
Estamos agora em condições de descrever o processo de relaxação. 


Seja o sistema linear : 
Ax+b=0, (5.14) 


onde A, n x n, é positiva definida; « e b são vetores n x 1. Portanto, o sistema (5.14) tem uma única 
solução. 
Se v é uma aproximação da solução então: 


r=Av+b, 
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é o resíduo. 
O objetivo do processo de relaxação é fazer com que o resíduo se anule. Para ver como é possível 
conseguir isso, consideremos, junto com o sistema de equações (5.14), a função quadrática: 


1 
F(v) = z (40,0) + (b, v) , (5.15) 
onde A = (aij); v = (v1, V2,..., Un)*; b = (by,bo,...,bn)*, sendo que (Av, v) > 0, com igualdade válida se 


e somente se v = 0 (vetor nulo). 
Portanto, calculando os produtos escalares da expressão (5.15), obtemos: 


5 Qijtit; + Dh Vi, 


2 


Observe agora que: 


n n 
J QijViVj = ) ) QijUViUVj 


i, j=1 i=1 j=1 
2 
= av + Q12V1U2 +... +aynvilVa 
2 
+ agyvavy + agovs +... + A2nV2Vn 


2 
+ AmUVnvi + ann +... + annVn > 


5 bivi = bivi EE bnUn . 


Portanto: 
GODA j=1 ijViVj 


du; = 2 a 3 


desde que A é simétrica, e 


Ovi E 
Logo, podemos escrever que: 
9F(v) i 
Em = 2 > ayy +b; 
j=1 
= QijUj tb i=1,..5,m 
j=1 
Agora: 
OF(v) ƏF(v) 9F(v) 
F(v) = f 
grad F(v) ( Do, oa? Dis 
Portanto: 
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n 
SS aizu + bi = 0,i=1,...,n. 
j=1 


Assim, temos que: Av +b = 0 = grad F(v). Mas, desde que Av + b = r, podemos concluir que 
grad F(v) =r. Assim, nosso objetivo é obter grad F(v) = 0, pois assim teremos r = 0. 


Teorema 5.2 - O problema de determinar a solução do sistema (5.14), onde A é positiva definida, é 
equivalente ao problema de determinar o ponto de mínimo de (5.15 

Prova: Evidentemente P = (x1, £2,..., £n)” é ponto estacionário da F se e somente se (£1, 12,...,%n) 
é solução de (5.14), pois se P é ponto estacionário da F então grad F = 0 = r = 0 = Pé solução de 


Ax+b=0. Resta provar que F tem um só ponto estacionário e que este ponto é de mínimo. 


Temos que v é ponto estacionário da F se e somente se grad F(v) = 0, isto é, se e somente se: 


Além disso, o ponto estacionário é único, pois, o sistema admite uma única solução. Como: 


Fw) Fv) x F) 
ðv “o Fov P? o dov; Ca + 
temos que: 
92 F(v) 
A = (aj) = 
(aij) ðvivj 


Agora, por hipótese, A é positiva definida. Assim v é ponto de mínimo. 


O exemplo a seguir ilustra o teorema anterior. 


Exemplo 5.4 - Seja o sistema linear Ax + b = 0, dado por: 
100 zı + z2 — 1 = 0 
zı + 100z2 — 100 = 0 


Calcule a função quadrática dada por (5.15) e mostre que o ponto de mínimo desta função é solução 
do sistema dado. 


Solução: É fácil verificar que a solução do sistema dado é: 


pe 


Formemos a função quadrática, F(v). Temos que: 
Av = (1001 vi 10001 + v2 
ida 1 100 vo vı + 1000, ) ` 


(Av,v) = 10007 + 2v1v2 + 10003, 


Assim: 
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(b v) = —v — 100v2 . 
Logo: 
1 
F(v) = 5 (10007 + 2v1v2 + 10002) — vı — 10005 . 


Além disso: 


92F F 
ðv? ðv ðvə 100 1 
= = Au 
92 F 92 F 1 100 
Ova0v1 Ová 


que é uma matriz positiva definida. 


Portanto F(v) tem ponto de mínimo em (0,1), que é a solução do sistema. O valor do mínimo é 
Fmin = —50. Assim, apesar da forma quadrática ser positiva definida, o mínimo pode ser negativo. 


Observe que os métodos de relaxação são usados apenas para sistemas cuja matriz dos coeficientes 
são positivas definidas. Se A é não singular, mas não é positiva definida não podemos aplicar o raciocínio 
apresentado. Os métodos de relaxação nestes casos não convergem. 


5.3.1 Príncipios Básicos do Processo de Relaxação 


Sejam v a solução inicial e r = Av + b o resíduo. Escolhemos uma direção p e variamos v nessa 
direção, com o objetivo de diminuir F(v), para ir atingindo seu ponto do mínimo que é a solução do 
sistema; ou seja, tentamos anular o resíduo na direção p. 


Assim, variando v na direção p, isto é, tomando: 
v =v+ tp, 


procuramos determinar o parâmetro t de modo que a função F diminua. Logo devemos procurar o 
mínimo de F na direção p. Temos então que: 


F(v) = T (Avu) + (b, v") 


(A(v + tp), v + tp) + (b, v + tp) 


NI = 


[(Av, v) + 2t(Av, p) + t? (Ap, p) 


NI = 


+ 2(b,v)+2t(b,p)] 


t2 
= F(v)+ zP p) +t(Av +b,p). 


desde que J [(Av, v) + 2t(b,v)] = F(v). Portanto: 


F(') = P(o) + E (Ap, p) + Hr) À 
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que é função do parâmetro t. 


O parâmetro t é selecionado de tal forma que F é mínimo dentro do conjunto acima examinado. À 
condição necessária para que isso ocorra é: 


OF (uv! 
(r, p) 
>t = — , 
(Ap, p) 

; da ; f 3? F(x") ; i Sad : : 
que é um ponto estacionário da F. Além disso E = (Ap, p) > O pois A é positiva definida e assim 
t é mínimo na direção p. 

Portanto: fed) 
rp 
Observações: 


1) Diferentes escolhas da direção p nos dão diferentes métodos de relaxação. 
2) O ponto v’, que é tomado na direção p de relaxação com t = tmin, é chamado ponto do mínimo. 


3) Analisando a equação ([5.16) com r = Av + b, notamos que a direção p de relaxação não deve ser 
escolhida ortogonal ao vetor resíduo r. Se assim fosse, o ponto v’ teria sempre tmin = 0 e não 
haveria melhoria na aproximação da solução. 


Teorema 5.3 - Para o ponto de mínimo v’ com t = tmin O novo resíduo r' = Av' +b é ortogonal à 
direção p da relaxação. 


Prova: Temos que: 


r = Av +b = A(v+tp)+b 
= Av+b+tAp 
>r = r+tAp. 


Portanto: 
(r',p) = (r+tAp,p) = (r,p) + t(Ap, p). 
Para t = tmin, segue que: 


1 = {pp (r, p) = 
(r p) = (r,p) cana) De) 0. 


Logo r’ e p são ortogonais, demonstrando o teorema. Observe que o novo resíduo não tem compo- 
nentes na direção p, ou seja, o novo resíduo, r’, se anula na direção p. 
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5.3.2 Método dos Gradientes 


Dado o sistema (5.14), com A positiva definida, construímos a função quadrática F (v). Vimos que a 
solução do sistema dado coincide com o ponto de mímimo de F(v) e que gradF (v) = Av +b = r. Aqui, 
definiremos a direção p de relaxação por: 


k 


pt = -r para k=1,2,... (5.17) 


Esta direção é dirigida para o ponto do mínimo. 


Todo processo iterativo onde a direção p de relaxação é a do resíduo em sentido oposto é chamado 
Método dos Gradientes. 


Temos que: 
(rp) (r58, p™) 
(Ap, p) (Apt) , pl) 


I 


tmin 


(r*-9, r&=D) 


usando (5.17). 


Vimos que ao usar tmin, O novo resíduo é ortogonal à direção de relaxação. Portanto neste processo 
resíduos consecutivos são ortogonais, isto é: 


(r, r0) =0 , k=1,2,... 
Assim, no método dos gradientes, temos que: 


v = ul 


> v) = qtD tnin MEDO (5.18) 


r = Auv +b 
EA — tmin r79) +b 
= AvD) +b- tmin Art) 
>r = Do tom ArtoD. (5.19) 


Resumindo: dados v(?) e e, onde e é uma precisão pré-fixada, para aplicar o método dos gradientes, 
devemos calcular: 
a) r® = Av® +b 
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b) para k = 1,2,... 


= (Re PR 
o (Ar®D, pita 


b.2) vt) = vD — tmir” 


b.3) r® = r&D — tmnAp™® Y 


(k+1) _ (k) 
Vo vV š 
b.4) Se | r% |< €, ouse em <e, Fim, 


caso contrario b) . 


Exemplo 5.5 - Usando o método dos gradientes obter a solução do sistema: 


10 1 0 zı 11 0 
1 10 1 T2 — 11 = 0 j 
0 1 10 T3 1 0 


com precisão de 1071. 
Solução: Seja v® = (0,0,0)*, então: 
O = Av® +b = —11 


Para k = 1, obtemos: 
(O 0) = 121 +12141=243, 


D 
3 
Ss 
II 
HS 
= 
SH 
Ea O 
hie] 
= = 
Hm 
| 
Io 
= = 
N N 
N e 


F 


0O 1 10 = —21 
(Ar® (0) = 1331 + 1342 + 21 = 2694 . 
Assim: 
a pose o 
mn 2694 j 
Agora, 
v) yO) =, t i r(0) 
0 —11 0.9922 
= o | -0.0902 | -1 | = | 0.992 |, 
0 —1 0.0902 
r) r0) Ea, Tits Ar®) 
—11 —121 —0.0858 
= —11 | — 0.0902 | -122 | = 0.0044 


—1 —21 0.8942 
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De maneira análoga, para k = 2, obtemos: 
(1 r®) = 0.8070 , 
—0.5360 
Ar) = | 0.8524 
8.9284 


(Ar®,r®) = 8.0336 . 


Assim: 
tmin = 0.1005. 
Portanto, 
1.0008 
vu = 0.9918 |, 
0.0003 


Agora, desde que: 
|| ut+D = v Ilo 0.0899 


= = 0.09 < 107}, 
|| v+D Jlo 1.0008 


temos que vt?) é solução do sistema dado, com e < 1071. 


Exercícios 


5.5 - Deseja-se resolver um sistema Ax + b = 0, onde a é real e : 


D 

I 
sem 
eme 
see 


pelo método dos gradientes. 


a) Quais os valores possíveis para a? 
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b) Sendo b= (1, 2, 3)* e considerando a = 0.4, obtenha a solução do sistema com duas casas 


decimais corretas usando o método dos gradientes. 


5.6 - Usando o método dos gradientes, obtenha a solução do sistema: 


(akl aJ = (6). 


com erro relativo inferior a 1073. 
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5.3.3 Método dos Gradientes Conjugados 


Um outro método de relaxação é o chamado Método dos Gradientes Conjugados. 


Definição 5.3 - Dada a aplicação linear A; positiva definida, x e y são direções conjugadas se 
(Ax,y) = (2,49) =0. 


O primeiro passo no método dos gradientes conjugados é igual ao primeiro passo do método dos 
gradientes; isto é, dado v(?), calculamos 1) = Av® 4 be fazemos: 


pur iu nh 
v® — vO) = tríO) ; 
onde 
pi E (r®, p®) = (r(0), r@) 
A (Ap, p®) (Art, (0) 
Portanto: (0) (0) 
DO e MERO mo] (5.20) 


(Ar(O, (0) 
Consideremos a passagem do passo k — 1 para o passo k, (k > 1). 


Tomamos a direção de liberação pt de tal modo que pt”) e p*-® sejam direções conjugadas, isto é, 
p(*) deve ser tal que: 
(Ap™,p™-0) = (p™, Ap™-®) = 0. 


Além disso, pt) é tomado como combinação linear de r(-D e pt-D e desde que o coeficiente de 
r(k-1) é não nulo podemos tomá-lo igual —1. 


Portanto: 
p™® = -rD + apip”? k = 2,3,... (5.21) 
onde &œk—ı é um coeficiente a ser determinado. 


Temos que, para k=2,3,...: 
(p™), Ap™-0) =0 
= (—ytk—D) + apa pt-D, Apt) =0 
> (-r6-D Apt-D) + ap a(pt-D Apt-D) =0. 


Da expressão acima podemos determinar ak-—1, isto é: 


(rE-D, Apt) 
Qk-1 = E ES (5.22) 
(pD, Apt) 


Uma vez, identificada a direção pt”, procuramos o ponto de mínimo. Assim, de v% = vE-D + tp”), 
obtemos que: 


É = tra, (5.23) 


CAPÍTULO 5. SOLUÇÃO DE SISTEMAS LINEARES: MÉTODOS ITERATIVOS 


onde 
(=D, pl) 
(Apt), p™)) 


dk = 
e de rt) = Av) 4 b, segue que: 


Afu ED + pt) +b 


= AvD +b+qrAp™ . 
Portanto: 
rE) = p(k-D 4 qu Apt? f 


Observações: 


i) O método dos 
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(5.24) 


gradientes conjugados é essencialmente definido pelas fórmulas (5.20), (5.21), (5.22), 
(5.23), (5.24), desde que um vetor aproximação v 


(0) tenha sido escolhido. 


ii) Os denominadores que aparecem nas fórmulas de ax-1 e qk São sempre maiores que zero, para 


direções não nulas pt”, pelo fato de A ser positiva definida. 


iii) O resíduo em cada passo, do método dos gradientes conjugados, possui as seguintes propriedades: 


1) é ortogonal ao resíduo do passo anterior, isto é: 
(O,rt-D)=0, 

2) é ortogonal à direção de relaxação do passo, isto é: 
(9,9) =0, 

3) é ortogonal à direção de relaxação do passo anterior, isto é: 


(ph =, 


Com estas propriedades, podemos obter simplificações para as fórmulas de qx e de a; -1. De fato, da 


fórmula de qk, obtemos que: 
(rlh= 1) 3 r(k-1)) 


dk = Re à 
(Apto, p™) 


desde que: 


— (=) pl) fp) pi 4 ap iph) 


(rE-D (=D) — api (ED pl) 


(rE) ql) , (usando a propriedade 2) , 
e da fórmula de &k—1, segue que: 
friso, le) 


Qk-1 = (6-9 (2) , 
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desde que, de (5.24), temos: 


Ap- = quai) (6-2) 
Gk-1 
Assim: 
(E-D Ap-D) = (r*-D, 1 (=D — (829) 
dk—1 


— 1 (r&-D lt) — l (pk) — (6-2) 
QGk—1 Gk—1 
1 


= e An) , (usando a propriedade 1), 
e 


(PED, Apte-D) — 1 (p), O — 1 


fp) 
Gk-1 Gk-1 


= == (pD O A ao , (usando a propriedade 2) 


Gk-1 dk—1 


1 
= — (r?) r(k-2)) usandoapropriedade? . 
dk—1 
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Resumindo, para aplicarmos o método dos gradientes conjugados devemos efetuar os seguintes passos: 


Dado v® e €, calcular: 
a) r® = Av® +b 


DD = to) 


(r(0), (0) 


2 = (arO, 0) 


OD = 4 qgp® 


rD = rO + q4pD 
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b) para k > 2 
(k—1) (k—1) 
r mig 
bl) oxı = E. 
b.2) pt = — p(k—1) + qua pt-D) 
b3) = (ED DA 


(Apto, pl) 
b.5) 10 = rD + qrAp™ 


Lv» — v% | 


o) STD] 


< e Fim 


caso contrário b) . 


Teorema 5.4 - No método dos gradientes conjugados, as direções de relaxação formam um sistema de 
direções conjugadas e os resíduos formam um sistema ortogonal, isto é, para i £ j, i,j =1,2,..., vale 
que: 


(Ap®,p®) = 0, 


(r® rO) = 0, 


Prova: A prova deste teorema pode ser encontrada em Rutishauser, Stiefel, Schwarz. 


Do fato de (r® ,r®)) = 0, concluímos que o método dos gradientes conjugados converge, teoricamente, 
em n passos, onde n é a ordem do sistema; isto porque os vetores r(? pertencem a um espaço vetorial n- 
dimensional, e assim o sistema ortogonal pode conter no máximo n vetores não nulos. Com isso podemos 
enunciar o seguinte: 


Teorema 5.5 - O método dos gradientes conjugados fornece a solução do sistema em no máximo n 
passos, onde n é a ordem do sistema. 


Observe que em geral, na prática, devido aos erros de arredondamento, não obteremos a solução do 
sistema em n passos. 


Exemplo 5.6 - Usando o método dos gradientes conjugados, obter a solução do sistema do exemplo 
anterior, com duas casas decimais corretas . 


Solução: Como o 1º passo do método dos gradientes conjugados é igual ao 1° passo do método dos 
gradientes, do exemplo anterior, temos: 


-11 
v® = (0,0,0) r®=| -11 
-1 
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p® = —r®) , qi = tmin = 0.09024 , 


0.9922 —0.0858 
v® = | 0.9922 | ,r® = 0.0044 
0.0902 0.8942 


Para k = 2, temos: 
(r®, r) 0.8070 


Qi = rO, rO) = 243 = 0.0033 , 
p = pasa) 
0.0858 11 
= —0.0044 | + 0.0033 | 11 
—0.8942 1 
0.1221 
>p = 0.0319 |, 
—0.8909 
10 1 0 0.1221 1.2529 
Ap = 1 10 1 0.0319 | = | —0.4498 |, 
0O 1 10 —0.8909 —8.8771 


(Ap pf) = 0.1530 — 0.0143 + 7.9086 = 8.0473, 


(r®, r® 0.8070 
E = = 0.1003 
2 = (apD,pD) — 80473 
vD = v pgp” 
0.9922 0.1221 1.0044 
= 0.9922 | + 0.1003 0.0319 | = | 0.9954 
0.0902 —0.8909 0.0008 
Para k = 3, segue que: 
0.0399 
O = r® +qgAp® = | —0.0407 |, 
0.0038 
(r,r) 0.0033 
E = = 0.0041 
“2 = rO, rO) * 0.8070 
per = rO Lao 
—0.0394 
= 0.0408 |, 
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—0.3532 
Ap = 0.3685 |, 
0.0398 


(Ap, p) = 0.0139 + 0.0150 — 0.0000 = 0.0289 , 


o (Or 00088 | ni 
B = (apDpo) 0.0289 0 
(Ap, p) 0.0289 


GE pO 


0.9999 
= 1.0001 
0.0008 


Agora, desde que: 
puttD = v Io 0.0047 


=: at —2 
EFD To oo E OO IDA, 


temos que v3 é solução do sistema, dado, com e < 1072. 


Exercícios 
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5.7 - Mostre que no método dos gradientes conjugados o resíduo em cada passo é ortogonal ao resíduo 


anterior, à direção de relaxação do passo e à direção de relaxação do passo anterior. 


5.8 - Usando o método dos gradientes conjugados resolver os sistemas dados nos exercícios 5.5 e 5.6. 


5.4 Exercícios Complementares 


5.9 - Supomos que o sistema: 


Li — axa = Ci 
—ax, + t2 — QT3 = co 
T AL + T3 = cg 


seja resolvido iterativamente pelas fórmulas: 


rft» = arp Fä 
xto E ala + z) + ca 
at = ar + c3 


Para que valores de aœ a convergência do método definido acima é garantida? Justifique. 
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5.10 - Considere o sistema Ax = b; onde: 


10 -1 4 £1 5 
A=| ı 10 9 |; z=| zz |; b=|2 
2 -3 -10 23 9 


Entre os métodos iterativos que você conhece qual você aplicaria? Por que? Resolva - o pelo método 
escolhido. 


5.11 - Considere o sistema Ax = b; onde: 


50 —1 4 zı 45 
A= 1 50 9 >; g=| 29 |; b=| 42 
2 —3 —50 T3 49 


Aplique a este sistema o mesmo método aplicado no exercício anterior. Como se comparam as taxas 
de convergência? Por que? 


5.12 - Considere os sistemas: 


5x1 sy: 2x9 EE lg = 0 5x1 Ti 4x5 -m lg = 2 
(I) 4 271 + 4r2 + x = 2 ; (ID 3a + 4r2 + gx = 2 
2x1 = 2x9 E 4x3 = 1 321 E 3x2 “m 6x3 = —9 


Aplicando os critérios que você conhece qual dos métodos iterativos será seguramente convergente? 
Justifique. 


5.13 - Considere o sistema: 


= Ti + 2x9 = T3 En poll 
211 ie T2 = | 
— Tv + 2r3 — q = 1 

— vw + z4 = 1 


Reordene as equações convenientemente e aplique o método de Gauss - Seidel com garantia de con- 
vergência. 


5.14 - Certos sistemas de equações lineares podem ser convenientemente tratados pelo método iterativo 


de Gauss - Seidel. Depois de uma simples generalização, o método pode ser também usado para alguns 
sistemas não lineares. Determinar desse modo uma solução do sistema: 


z — Oly? + 0.05z? = 0.7 
y + 0372 — Olrz = 0.5 
z + 04) + Olxz = 1.2 


com erro relativo inferior a 1072. 


5.15 - O sistema : 
ax +by+c=0 
dr +ey+f=0 
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Começamos com uma solução aproximada (£k, Yk) e construímos a seguinte, primeiro mantendo y = 
Yk e variando x. O ponto de mínimo é chamado xk,1. A seguir, mantendo x = zk+,1 e variando y. O 
ponto de mínimo é chamado yr +1. O processo é repetido iterativamente. 

Aplicar o método descrito acima ao sistema: 


5r + 2y — 11 = 0 
q — 3y — 9 =0 


5.16 - Um processo iterativo para resolver sistemas de equações do tipo Ax — b = 0 é assim definido: 
e somar Ix a ambos os membros, obtendo (I + A)x —- b=4, 
e realizar iterações a partir de x®) fazendo: 
gt = (T+ Ae —b . 
a) Dê uma condição suficiente que assegure a convergência deste processo iterativo. 
b) Aplique este processo para determinar a solução do seguinte sistema: 


0.371 =s 0.3%x5 — 


5.17 - Considere cada um dos seguintes sistemas de 3 equações: 


341 m 3x2 RD 7x3 = 18 Lt + 2x9 E 543 = 20 
(1) zı + 61 — z3 = 10 ; (ID zı + 3r2 + z3 = 10 
10x; Ee 2x9 T T3 N; 414 =: LX o 2x3 = 12 


a) Sem rearranjar as equações, tente achar as soluções iterativamente, usando os métodos de Jacobi 
e de Gauss - Seidel, começando com z®) = (1.01,2.01,3.01)*. 


b) Rearranje as equações de tal modo que satisfaçam os critérios de convergência e repita o que 
foi feito no item a). 


c) Verifique suas soluções nas equações originais. 


5.18 - Considere o sistema: 


-1 2 -1 0 21 1 
2 -1 0 0 2 | o |2 
0 -1 2 -1 zs |7| 9 
0 0 -1 2 z4 11 


a) E possível aplicar a este sistema os métodos iterativos que você conhece com garantia de 
convergência? 


b) Reordene as equações convenientemente de tal forma que seja possível aplicar o método de 
Gauss-Seidel com garantia de convergência. 


5.19 - Dado o sistema linear: 


œa 2 —2 Tı 1 
l a 1 T2 = 2 
2 2 A T3 3 


para que valores de œ haverá convergência se desejarmos utilizar o método de Jacobi? 


CAPÍTULO 5. SOLUÇÃO DE SISTEMAS LINEARES: METODOS ITERATIVOS 184 


5.20 - Considere o sistema linear do exercício anterior coma =1 e «0 = (1, 2, 3). A aplicação 
do método de Jacobi fornece a tabela: 


k |o ıı 2 
a L 3 1 -1 
a |2 -2 2 


T3 3 —3 1 1 


Existe alguma contradição com o exercício anterior? Você saberia explicar porque o método de Jacobi 
convergiu. 


5.21 - Considere o sistema linear Ax = b, onde: 


20 3 1 
A= a 20 1 
1 a 6 


Para que valores de a o critério das linhas é verificado? 


5.22 - Supondo que o sistema linear Ax = b, onde A é a matriz do exercício anterior, esteja sendo 
resolvido pelo método de Jacobi-Richardson, para quais valores de a, pode-se afirmar que: 


1 
|l até) = Is 2 | grs) —% oo , 


onde at) e x} são aproximações para a solução e Z é a solução exata. 


5.23 - O sistema linear Ax = b: 


aliea a)(i] cem 


pode, sob certas condições, ser resolvido pelo seguinte método iterativo: 


(IT) 1 0 DA  /1-w wa sP) E wb 
—wa 1 aço) = 0 1-w ao wba j ` 


a) Mostre que se w = 1 o método iterativo (II) é o método de Gauss-Seidel. 


b) Considere em (I), a = bı = b2 = 0.5. Usando o processo iterativo (II), com w = 1, determine 
a solução deste sistema com precisão de < 1072. Tome como vetor inicial a! = (0.9,0.9)*. 


5.24 - Dado os sistemas: 


nf Gr — T2 E F E + 29x, = 33 


FL F 9T2 29x1 ope 31x2 =" 21 
a) Construa as funções quadráticas cujos mínimos são as soluções dos sistemas. 
b) Determine o número de condição para cada sistema. 
c) Com base no número de condição de cada sistema o que você pode concluir? 


d) Resolva o sistema (IT) pelo método dos gradientes conjugados. Qual é a aproximação ao fim 
de dois estágios? 
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5.25 - Dado o sistema de equações: 


2 -1 0 0 zı 3 
-1 4—1 0 T2 o 5 
0 -1 4 -1 23 = | -15 
0 0 -1 2 24 7 


cuja solução é x = (2, 1, —3, 2, 


a) resolva-o pelo método dos gradientes conjugados, efetuando os cálculos com 4 algarismos sig- 
nificativos; 


b) mostre a ortogonalidade dos vetores resíduos (como verificação dos cálculos efetuados). 


5.5 Problemas Aplicados e Projetos 
5.1 - Uma maneira de se obter a solução da equação de Laplace: 


Ou Ou 


TT di 


em uma região retangular consiste em se fazer uma discretização que transforma a equação em um 
problema aproximado consistindo em uma equação de diferenças cuja solução, em um caso particular, 
exige a solução do seguinte sistema linear: 


4 -1 0 -1 0 0 Tı 100 
E 4-1 0 -1 0 Tə 0 
0—1 4 0 0 -l T3 o 0 
E 0 0 4 = 0 za z 100 
0 -1 0 -1 4 -1 T5 0 
0 0 -1 0 -1 4 Te 0 


Se desejamos a solução com quatro algarismos significativos corretos, qual dos métodos iterativos que 
você conhece poderia ser aplicado com garantia de convergência? Resolva o sistema pelo método escolhido. 


5.2 - Considere o circuito da figura a seguir, com resistências e baterias tal como indicado; escolhemos 
arbitrariamente as orientações das correntes. 


26V fa) $109 fa) SaR 
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Aplicando a lei de Kirchoff, que diz que a soma algébrica das diferenças de potencial em qualquer 
circuito fechado é zero, achamos para as correntes iy,t2,13: 


611 10(i i2) 4(iy i3) 26 = 0 
Sigo + Sig + 5(iz — i3) + 10(i2 = i1) =0 
1lis 4 4(i3 i1) 5(i3 i2) T=0 


a) E possível aplicar ao sistema acima o método de Gauss - Seidel com convergência assegurada? 
Justifique. 


b) Se possível, obtenha a solução com erro relativo < 107?. 


5.3 - Suponha uma barra de metal homogêneo, como na figura a seguir, onde AB = CD = 4: AC = 
BD =3. 


y 
1º D 
C 
0º R 0º 
A 0º B z 


A temperatura ao longo de AB, AC, BD é mantida constante e igual a 0°C, enquanto que ao longo 
de CD ela é igual a 1°C. A distribuição do calor na barra R obedece à seguinte equação: 


du u 
SEa .2 
Ox? se Oy? D, (5.25) 
com as condições de contorno: 

ulx,y) = 1 para O<xr<4, 

u(x,0) = 0 para O<au<4, 

u(0,y) = 1 para 0<y<3, 

ulx,y) = 0 para 0<y<3. 


A solução numérica desse problema pode ser obtida considerando-se uma divisão do retângulo ABCD 
em retângulos menores a partir de uma divisão de AB em intervalos iguais de amplitude h e de uma 
divisão de CD em intervalos iguais de amplitude k,como é mostrado na figura a seguir: 
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Us u5 us 


A B 


Nessa figura estamos considerando h = k = 1. A temperatura u nos pontos internos pode ser obtida 


numericamente simulando as derivadas segundas de (5.25 , pelas diferenças de segunda ordem A2u de 
modo que para h = k, obtemos: 


u(x — h,y) — 2u(2,9) + ulz +h,y)  u(z,y— h) — 2u(2,9) + ulz, y+ h) 
h2 ki h2 


para cada par (x,y) em R. Assim, por exemplo, para o ponto w = u(1,2) da figura anterior vale: 


= 0, 


u(0,2) — 2u; + us us — 2u; +u(1,3) 
12 n 12 


= 0. 


Considerando todos os pontos da figura anterior obtemos um sistema de 6 equações lineares nas 
incógnitas:u, u2,..., ug. Resolva-o por método numérico à sua escolha, com garantia de convergência. 


5.4 - Considere a malha quadrada da figura a seguir, cujos bordos AC e BD são mantidos à temperatura 
de 20°C, o bordo AB, à 40ºC, e CD à 10°C, com o uso de isolantes térmicos em A, B,C, D. 


0 A 40°C B 
1 
2 
20°C 20°C 
3 
4 
5 
C 10°C D 


Para determinar as temperaturas de pontos interiores da malha, pode-se supor que a temperatura em 
cada ponto é igual à média aritmética dos quatro pontos contíguos. Por exemplo: 


— Too + T31 + T33 + Ty 


T32 Fi 
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As 16 relações deste tipo permitirão formar um sistema de 16 equações a 16 incógnitas Tij. Resolva-o 


por método numérico com garantia de convergência. 


5.5 - Suponha que uma membrana com dimensões 80 cm x 80 cm tenha cada um dos seus lados man- 
tidos a uma temperatura constante. Usando a teoria de equações diferenciais parciais pode-se formular 
uma equação que determina o valor da temperatura no interior dessa membrana. Essa equação diferen- 
cial pode ser simplificada colocando-se uma malha com 9 pontos sobre essa membrana e calculando-se a 


temperatura nos pontos da malha, como mostra a figura: 


50ºC 
us ua us 
0°C ne URE ae 100°C 
ur us ug 
50ºC 
onde u1, u2,...,U9 são os valores da temperatura em cada ponto da malha. 
O sistema de equações resultante é dado por: 
—4 1 1 um 
1 —4 1 1 uz 
1 —4 1 us 
1 —4 1 1 u4 
1 1 —4 1 ug 
1 —4 1 u7 
1 1 —4 1 us 
1 1 —4 ug 


Encontre a solução do sistema por método numérico à sua escolha, com garantia de convergência. 


5.6 - Suponha que tenhamos um circuito que consiste de fontes de tensão independantes e resistores 


concentrados como mostra a figura: 


Rı ape Rs 

n 

E R7 R3 Re E 
Ks FR 


—100 
—50 
—50 

—150 
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A análise completa de tal circuito requer a determinação dos valores das correntes da malha ip, 
indicados na figura, para os valores especificados das fontes de tensão e dos resistores. é necessário, 
então, formular um sistema de equações simultâneas com as quantidades à; como incógnitas. Cada uma 
das equações de tal sistema é determinada pela aplicação da lei de Kirchoff em torno das malhas. 

Por exemplo, para a malha definida pela corrente ài1, temos: 


Rin+Ro(ii— i2) + Rali — i4) = V1. 
Fazendo um cálculo semelhante para as outras malhas obtemos um sistema de 6 equações nas incógnitas 
il, t2, t3, 4, i5, t6- 
Resolver este problema para os seguintes dados: 


R = (10, 13,7, 12,20, 5,6, 10,8,9, 20)¢ , 


V = (29, 32, 37, 24, 24,34} , 
onde R em Ohms e V em Volts. 


5.7 - Numa treliça estaticamente determinada com juntas articuladas, como dada na figura a seguir: 


1000 500 
S Fa E 
A, Ao 
F, F; F; Fo 
F3 
45º a 45° 
O O © 
No Fo Fe 500 Fs 
PLAI M -OOO 


a tensão, (F; ), em cada componente pode ser obtida da seguinte equação matricial: 


0.7071 0 0 —1 —0.8660 0 0 O 0 0 
0.7071 0 1 0 0.5 0 0 0 0 —1000 
0 1 0 0 0 -1 0 0 0 0 
0 0 —1 0 0 0 0 0 0 0 
0 0 0 0 0 0 1 0 0.7071 F= 500 
0 0 0 0 0 0 0 0 —0.7071 0 
0 0 0 0 0.8660 1 0 — 0 0 
0 0 0 0 —0.5 0 —1 0 0 —500 

0 0 0 0 0 0 0 1 0.7071 0 


Observe que as equações são obtidas fazendo-se a soma de todas as forças horizontais ou verticais em 
cada junta igual a zero. Além disso a matriz dos coeficientes é bastante esparsa, e assim um candidato 
natural é o método de Gauss-Seidel. 


a) As equações podem ser rearranjadas de modo a se obter uma matriz estritamente diagonal- 
mente dominante? 
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b) Eo sistema convergente se iniciarmos com um vetor com todas as componentes iguais a 
zero? 


c) Resolva o sistema pelo método de Gauss-Seidel, partindo do vetor nulo e obtendo a solução 
com precisão de 1074. 


5.8 - O circuito mostrado a seguir é frequentemente usado em medidas elétricas e é conhecido com uma 
“Ponte de Wheatstone”. 


As equações que governam o sistema são obtidas a partir da lei de Kirchoff. Para a malha fechada 
através da bateria e ao longo de ABD, temos: 


LR +L4R,-E=0 (1) 


Para a a malha fechada ABCA: 
lh Ri + I5 R5 = Ia Rə — 0 (2) 


Para a malha fechada BCDB: 


Rs + IRs- LR4=0 (3) 


Para o nó A: 
I= h+ (4) 


Para o nó B: 


Para o nó C: 


Ils=Lb+1I (6) 


onde R; representam as resistências; 1; as correntes e E a voltagem aplicada. 


Determinar as correntes no problema proposto quando: E = 20 Volts, Rı = 10 Ohms e Rə = R3 = 
R4 = Rs = 100 Ohms. 


Capítulo 6 


Programação Matemática 


Com o objetivo de facilitar o aprendizado do estudante, pretendemos aqui relembrar alguns conceitos 
básicos, que irão facilitar a compreensão dos métodos numéricos apresentados nos próximos capítulos. É 
claro que esperamos que o aluno para fazer um curso sobre métodos numéricos já possua conhecimento de 
alguns conceitos, principalmente, da álgebra linear e do cálculo diferencial e integral. Como é impossível 
relembrar todos os conceitos dessas duas áreas, salientamos que, a maioria dos conceitos aqui apresentados 
são de álgebra linear, e uma análise mais profunda pode ser encontrado em livros dessa área. 


6.1 Espaço Vetorial 
Pretendemos aqui definir importantes noções de dependência linear, base, dimensão e mudança de 


base em um espaço vetorial. 
Este Capítulo é do Marcos Arenales 
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Capítulo 7 


Determinação Numérica de 
Auto-Valores e Auto-Vetores 


7.1 Introdução 


Auto-valores e auto-vetores estão presentes em diferentes ramos da matemática incluindo formas 
quadráticas, sistemas diferenciais; problemas de otimização não linear, e podem ser usados para resolver 
problemas de diversos campos, como economia, teoria da informação, análise estrutural, eletrônica, teoria 
de controle e muitos outros. 

Nosso objetivo nesse capítulo é apresentar métodos numéricos para a determinação dos auto-valores 
e correspondentes auto-vetores de uma matriz A de ordem n. Sugerimos ao leitor rever a seção sobre 
auto-valores e auto-vetores dada no Capítulo 1. A menos que a matriz seja de ordem baixa ou que tenha 
muitos elementos iguais a zero, a expansão direta do determinante para a determinação do polinômio 
característico, ver exemplo [1.22] é ineficiente. Assim os métodos numéricos que estudaremos são obtidos 
sem fazer uso do cálculo do determinante. Tais métodos podem ser divididos em três grupos: 


i) métodos que determinam o polinômio característico, 
ii) métodos que determinam alguns auto-valores, 
iii) métodos que determinam todos os auto-valores. 


Nos dois últimos casos determinamos os auto-valores sem conhecer a expressão do polinômio carac- 
terístico. 

Em relação aos métodos do grupo i), uma vez determinado o polinômio característico de 4, para 
calcular os auto-valores devemos utilizar métodos numéricos para determinação de zeros de polinômio, 
(ver Capítulo 3). Nessa classe encontram-se, entre outros, os métodos de Leverrier e Leverrier-Faddeev. 

Os métodos do grupo ii), chamados iterativos, são usados se não estamos interessados em todos os 
auto-valores de A. Incluem-se nessa classe os métodos das potências, potência inversa. 

Em relação aos métodos do grupo iii), podemos dividí-los em duas classes: 


a) métodos numéricos para matrizes simétricas, 
b) métodos numéricos para matrizes não simétricas. 


Na classe a), inclui-se entre outros, o método de Jacobi, o qual reduz uma dada matriz simétrica numa 
forma especial, cujos auto-valores são facilmente determinados. Entre os métodos da classe b) podemos 
citar os métodos de Rutishauser (método LR) e o de Francis (método QR) os quais transformam a 
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matriz dada numa matriz triangular superior. Todos os métodos do grupo iii) fazem uso de uma série de 
transformações de similaridade e assim são algumas vezes referenciados como métodos de transformações 
ou métodos diretos. 

Maiores detalhes sobre essas técnicas, bem como sobre a teoria desses métodos podem ser encontradas 
em [Wilkinson,1965]. 


Descreveremos e exemplificaremos cada um dos métodos numéricos mencionados acima, iniciando com 
aqueles que determinam o polinômio característico. Antes porém precisamos do seguinte resultado. 


Teorema 7.1 - (Teorema de Newton ) - Seja o polinômio: 


P(x) = aoz” + arl + ... + ant + an, 
cujas raízes são: £1, T2,...,&En - Seja ainda: 
n 
= k 
Sk = > rti sy 1<k<n, 
i=1 
então: 
k—1 
J QiSk-1 + kak = 0 , k=1,2,..., n. 
i=0 


Prova: A prova deste teorema pode ser encontrada em [Jennings,19..]. 


Através desse teorema vemos que existe uma relação entre os coeficientes de um polinômio e as somas 
das potências das suas raízes. Assim, conhecidas as somas das potências das raízes do polinômio podemos 
determinar os coeficientes do mesmo. 


Exemplo 7.1 - Sejam sı = 6, s2 = 14, s3 = 36 as somas das potências das raízes de um polinômio 
P(x). Determinar P(x). 


Solução: Pelo teorema [7.1] temos: 


k=l > aoss + q = 0 > aı = —aos1 
k=2 > a@oS2 + a@aısı + 2a = 0 = 245 = —aoS2 — 1S1 
k=3 > aos3 + aıs2 + a2s1 + 3a3 = 0 > 

> 3a3 = —ags3 — 182 — A251 


Tomando o coeficiente do termo de maior grau do polinômio igual a 1, isto é, fazendo ag = 1, obtemos 
por substituição nas expressões anteriores que: 


Portanto, o polinômio procurado é: 
P(x) = 2º — 67º +1lr-—6. 
Logo, o conhecimento dos sp,k = 1,...,n, proporciona a determinação dos ap, k = 1,2,...,n. Ob- 
serve que nesse exemplo as raízes do polinômio são: zı = 1, £2 =2 e 73 = 3. 
Para os métodos numéricos descritos a seguir usaremos a seguinte notação para o polinômio carac- 


terístico de uma matriz A, de ordem n: 


P(A) = (—1)” [A a pA Ae DnA — pn] . (7.1) 
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7.2 Método de Leverrier 


O Método de Leverrier fornece o polinômio característico de uma matriz A de ordem n. 


Seja A uma matriz quadrada de ordem n. Se Ay, A»,..., An São os auto-valores da matriz 4, isto é, 
se A, Ao,... Àn São os zeros do polinômio (7.1) e se 


n 
Sk = 5 no > 1< k<n, 
i=1 
então, pelo Teorema [7.1] temos: 
kpk = Sk — Pi Sk1>--—Peass , I<Xk<n. (7.2) 
Portanto, se conhecermos os sķ,1 < k < n, poderemos determinar os coeficientes p1,p72,...,Ppn de 
P(X). 
Vejamos então como determinar as somas parciais są. Fazendo expansão direta do determinante de 
A — AI, o coeficiente de A”7t em P(A) é (—1)”7t (a11 + a22 + ... + ann). Por outro lado esse mesmo 


coeficiente em é (—-1)"-1py. Logo devemos ter: 
pı = Q11 + a22 +... + ann . 


A soma dos elementos da diagonal principal de uma matriz A é conhecida como traço de A, cuja 
notação é tr( A). Além disso, de (7.2), sı = pı, e assim: 


sı = tr (A) y 


isto é, a soma dos auto-valores da matriz A é igual ao traço de A. 
Então, desde que os auto-valores de A" são a ke potência dos auto-valores de A, (ver exercício [1.26), 
temos: 
Sk = tr(AP) a 


Assim os números s1,82,...,Sn São obtidos através do cálculo das potências de A, e (7.2) pode ser 
usada para determinar os coeficientes do polinômio característico. Determinando as raízes desse polinômio 
por qualquer dos métodos numéricos estudados no Capítulo 3, obtemos os auto-valores de 4. 


Exemplo 7.2 - Seja: 


Determinar seus auto-valores usando o Método de Leverrier. 


Solução: Temos: 


2 00 
s2 = tr(4), Ê = AA = —1 1 0 > 89 = 3, 
-1 -1 2 
2 2 —2 
s3 nd; Æ = dd = -1 -1 2 , > sy = 3. 
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Usando (7.2), obtemos: 


p= s > p=l, 

2p2 = s2—pıSı > pP = 2, 

3p3 = $3 — pısS2 — p251 p3 = —2. 
De (7.1), segue que: 

P(A) = (DN — pi App) 


(—1)ë (A8 — X +21 2) 
E E E 


Para determinar os auto-valores de A basta determinar os zeros de P(A). É fácil verificar que À = 1 
é uma raiz de P(A). Usando o algoritmo de Briot-Ruffini-Horner, (Capítulo 3), obtemos: 


= do 2 —2 
1 —1 0 2 
-1 0 2 0 


Assim, P(A) = (A — 1)(-A2 + 2). Logo os auto-valores de A são: A = 1, A = — V2 e à = v2. 


Exercícios 


7.1 - Usando o método de Leverrier, determinar o polinômio característico e os auto-valores do operador 


T: R? — IRÊ, definido por: 


T(x,y,2) = (Qu+ty, y— z, 2y +42). 


7.2 Seja: 
1 =3 3 
A= 3 —5 3 
6 —6 4 


Determinar seu polinômio característico e seus auto-valores pelo processo de Leverrier. 


7.3 Método de Leverrier-Faddeev 


Uma modificação do método de Leverrier, devida a Faddeev, simplifica os cálculos dos coeficientes 
do polinômio característico e fornece, em alguns casos, os auto-vetores de A. Tal método é conhecido por 
Método de Leverrier-Faddeev. 

Para descrever tal método, definimos uma sequência de matrizes: 


Ai, Ao,..., An, 
do seguinte modo: 
A = A, q = trÃ, B= 4 —ql; 
A = AB, p = Tão, B> = A — ql, 
(7.3) 
As = AB, q = “ja, B3 = As — gl; 


A = ABp1, = Udo, Ba = A ql. 


E 
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Propriedades da sequência: A1, 45,...,4, 

12) Os termos qx obtidos na sequência (7.3), são os coeficientes do polinômio característico (7.1), isto é: 
dk = Pk, k=1,2,...,n. 

Prova: A prova será feita por indução. 


a) Desde que A = Aı, segue que: qı = tr( A1) = tr(A) = pı. 
b) Suponhamos que: q; = pi, i = 1,2,...,k— 1. 


c) Provemos que: qk = pp. Por (7.3), temos: 
A = A, 
As = ABı = A(Aı — qI) = A(A- qgI)= 82- q4, 
As = AB = A (A — I) = A (£? — q A — qT) 


= A -— qA? —qA, 


Ap = ABp = A(Ap 1 — qk-11) 
= AF = qu Ar = q2 A®7? = gia qk-14 » 


Desde que q; = pyi=1,2,...,k— 1, (hipótese de indução), obtemos: 
Ar = AF — p AFT! — pa AF? —...— ppiA. (7.4) 
Aplicando traço em ambos os membros da igualdade (7.4), segue que: 
tr(Ak) = tr (A) — pıtr (4) — potr (A?) —...— ppatr(A). 


Agora, desde que s; = tr(A), i=1,2,...,k,e, por (1.3) dk = Eras), obtemos: 


kdk = 8k—PiSp-1— PaSp-2— ...— Pp-282 — Pk—151 - (7.5) 


Comparando com (7.2), obtemos: 


o que completa a prova. 

2a) Se A é uma matriz de ordem n, então: 

Ba =0 (matriz nula). 
Prova: Pelo Teorema de Cayley-Hamilton, (Teorema [1.8), temos: 
A” — pi A — ... — Ppi Á — mII=9. 
Mas, por (7.3), e usando a 1apropriedade, segue que: 
Bn = A, — pal. 
Fazendo k = n em e substituindo o valor de An, na expressão anterior, obtemos: 


Bn = A” — p14”! E Pn-2. 4? = Pn-1Ã = Pnl = 0. 
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32) Se A é uma matriz não singular, de ordem n, então: 


1 
AT = — Banı. 
Pn 
Prova: De B, = 0 e Bn = A, — pal, temos: 
An = Pnl- 
Mas, por (7.3), 
An = ABr. 
Logo: 
ABn-ı = Pnl . 


Se A é não singular então existe A71. Assim, pré-multiplicando ambos os membros da igualdade 


anterior por 4-1, segue que: 
1 
A™ = Bai 


Pn 


Observações: 


a) Com o método de Leverrier-Faddeev, obtemos o polinômio característico de A. Para determinar seus 
auto-valores basta determinar os zeros de P(A). 


b) Se ao fazer os cálculos Bn resultar numa matriz diferente da matriz nula, você terá cometido erros 
de cálculo. 


c) Como B, = 6 e como B, = A, — pnl então A, é uma matriz diagonal com todos os elementos não 
nulos iguais a pn. 


d) Se A é singular então pn = 0. Nesse caso À = 0 é um auto-valor de A. 


Cálculo dos Auto-Vetores 


Sejam A1, Às,..., An auto-valores distintos de A. Mostraremos a seguir que cada coluna não nula da 
matriz: 


Qk = ALII + AT? Bi +... +AkBn-2 + Bni, (7.6) 


é um auto-vetor correspondente ao auto-valor Ay. 


Observações: 

1) Em (7.6), B;,i =1,...,;n — 1, são as matrizes calculadas para a determinação dos coeficientes do 
polinômio característico, isto é, são as matrizes obtidas em (7.3), e Ak é o k-ésimo auto-valor de A. 

2) Pode-se provar que Qk é matriz não nula se os auto-valores de A são distintos. 

3) Pode ocorrer que mesmo com À; iguais a matriz Q, não seja nula. 


Provemos agora que cada coluna não nula de Qk é um auto-vetor correspondente ao auto-valor Ap. 
Temos: 
(MAIA) Qk = (MAI A) (ARTH HAR? B, +... + MkBn-2 + Bai) 
= MI+NMT!(B/—- A) + à}? (B — ABy) +... 
Ag (Bn-1 — ABa-o) — AB 
ARI — map I — poa I-...—-praAl -prl = 0, 


+ 
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desde que Ay é auto valor de A e portanto é raiz do polinômio característico. Assim, acabamos de mostrar 
que: 
AQk = Ap Ok; 


Portanto, construídas as matrizes B; e determinados todos os auto-valores da matriz A, para obter 
os auto-vetores correspondentes ao auto-valor Ay basta calcular a matriz Qx usando (7.6). Entretanto, 
observe que se u é alguma coluna não nula de Qk, então, podemos escrever que: 


Au = Aju. 


isto é, u é auto-vetor de A correspondente ao auto-valor Ay. Assim, ao invés de determinarmos a matriz 
Qk, é muito mais vantajoso calcularmos apenas uma coluna u de Qk, da seguinte maneira: Fazemos, 


uo = e 
(7.7) 
ui = Ar + bi, i= 1,2,...,n— 1, 
onde e é uma coluna adotada da matriz identidade e b; é sua correspondente coluna da matriz B;, isto 
é, se adotamos e como sendo a i-ésima coluna da matriz identidade então b1, b2,...,bn—1 em serão, 
respectivamente, a i-ésima coluna das matrizes B1, B5,...,Bn-1. Logo, u = un-1 é o auto-vetor 


correspondente ao auto-valor A. Note que em (7.7), i varia de 1 até n — 1 pois Bn = 0. 
Observe que se calcularmos até u,-1 e este resultar no vetor nulo, devemos adotar outra coluna da 
matriz identidade e refazer os cálculos, pois por definição o auto-vetor é um vetor não nulo. 


Exemplo 7.3 - Considere a matriz dada no exemplo [7.2] Usando o método de Leverrier-Faddeev, de- 
terminar: 


a) seu polinômio característico, 
b) seus auto-valores e correspondentes auto-vetores, 


c) sua inversa. 
Solução: 


a) Para determinar o polinômio característico devemos construir a sequência A1, A2, A3. Assim, 
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usando (7.3), obtemos: 


1 1 + 
A = A= 0 0 1 |, p = tr(4) > p =1, 
—1 1 0 
0 —1 
Bı, = Aı— pyl > Bı = 0 —1 1 E 
—1 1 -1 
1 —1 1 
A& = AB > dp -1 1 a)l, 
0 —2 2 
tr(Aə) 4 
= ER 2 
Pa 2 Pa 2 Pa , 
-1 -1 1 
Bə = Ao — pol Bə = 1 1 1 3 
0 —2 0 
—2 0 0 
A3 = AB, > As = 0 —2 0 ; 
0 0 —2 
tr(A3) —6 
= = -2 
P3 3 P3 3 P3 , 
Bs = As = pal > Bs = 0 . 
Usando (7.1), segue que: 
PA) = (DN — pi A? — pÀ — ps) 


= (-1)8 (X3 — X +2)—2) 
A3 +2)? — 2A +2. 


Para determinar os auto-valores de A basta determinar os zeros de P(A). Já fizemos esses cálculos no 
exemplo [7.2] e obtivemos: àı = 1, A = -v2e A = V2. 


b) Determinemos agora os auto-vetores correspondentes a esses auto-valores. 


b.1) Para A = 1, seja e= (1, 0, 0). Assim: 


1 
uo = e > up = 0 5 
0 
1 
ui = à1uo +b1 > w = 1 0 + 0 > = 0 j 
0 —1 —1 
1 —1 0 
uz = 1u +b2 > us=1 0 + —1 > U= —1 
—1 0 —1 


Logo u= (0, —1, —1)* é um auto-vetor correspondente ao auto-valor À = 1. 
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Observe que se adotamos e = (0, 1, 0)* obtemos us = (0, —1, —1)* que é auto-vetor de A correspon- 
dente ao auto-valor A = 1; mas se adotamos e = (0, 0, 1)* obtemos us = (0, 0, 0)* e assim com esse 
vetor inicial não obtemos uma resposta válida. 


b.2) Para à = — v2, seja e= (1, 0, 0). Assim, 


1 
uo = e => uo = 0 , 
—v2 
ui = Asuo + bı > u=-V2 0 + 0 > u= 0 i 
0 —1 —1 
-y2 —1 1 
us = Agu +b2 > us = — V2 0 + —1 > Uz = —1 
-1 0 v2 
Logo u= (1, —1, v2)* é um auto-vetor correspondente ao auto-valor A, = — v2. 


Novamente, observe que se adotamos e = (0, 1, 0)* obtemos us = (-1-V2, 1+ v2, -2- VD), 


enquanto que e = (0, 0, 1)* fornece uz = (1 4 v2, —1 — 2, 2+ v2)*. Ambos são auto-vetores de A 
correspondentes ao auto-valor As = —v. 


b.3) Para Às = v2, seja e= (1, 0, 0). Assim: 


1 
uw=e > w=ļ| 0 j 
v2 
ui = àguo +b) > u = v2 0 + 0 > U = 0 3 
0 —1 —1 
V2 —1 1 
uz =Au+b > uz = V2 (0) + —1 > Ug = —1 


—1 0 —V2 


Logo u= (1, —1, — 2)! é um auto-vetor correspondente ao auto-valor As = v2. 


Observe que se adotamos e = (0, 1, 0)* obtemos us = (—1 + v2, 1 — v2, —2 + V2)*, enquanto que 


e = (0,0, 1) fornece us = (1 — v2, —1 + v2, 2- V2)!. Novamente, ambos são auto-vetores de A 
correspondentes ao auto-valor As = 2. 


Finalmente observe que para cada auto-valor Ay, a escolha do vetor inicial produz exatamente a co- 
luna correspondente da matriz Qk. Entretanto, como pode ser observado nesse exemplo, não é necessário 


calcular todas as colunas da matriz Q,., isto é , basta uma, pois as colunas não nulas de Qk são múltiplas 
uma das outras. 


c) Pela 3º propriedade, temos: 


HE =— — Bə , 
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e assim: 
i sï- o 0.5 0.5 —0.5 
At = 5 1-1 + > Al = 0.5 0.5 05 
E 0—2 0 0 1 0 
Exercícios 
7.3 Seja: 
3 3 -3 
A= -1 9 1 
6 3 -6 


Usando o método de Leverrier-Faddeev, determinar: 
a) seu polinômio característico, 
b) seus auto-valores e correspondentes auto-vetores, 
c) Am, 
7.4 - Seja T: IR? > IR?, definido por: 
T(x,y) = (3x + 5y, 3y). 


Usando o método de Leverrier-Faddeev, determinar seus auto-valores e correspondentes auto-vetores. 


7.4 Método das Potências 


O Método das Potências consiste em determinar o auto-valor de maior valor absoluto de uma 
matriz A, e seu correspondente auto-vetor, sem determinar o polinômio característico. O método é útil 
na prática, desde que se tenha interesse em determinar apenas alguns auto-valores, de módulo grande, 
e, que estes estejam bem separados, em módulo, dos demais. Podem surgir complicações caso a matriz 
A não possua auto-vetores linearmente independentes. O método das potências baseia-se no seguinte 
teorema. 


Teorema 7.2 - Seja A uma matriz real de ordem n e sejam A1, À», ..., An seus auto-valores e uy, U2, ..., Un 
seus correspondentes auto-vetores. Suponha que os auto-vetores são linearmente independentes, e que: 


Dil > |M|>D... > Mnl. 
Seja a sequência yk definida por: 
ver = Ayp, k=0,1,2,..., 


onde yo é um vetor arbitrário, que permite a expansão: 


com cj escalares quaisquer e cı £ 0, então: 


po doa 
k—00 (Yk)r 


onde o índice r indica a r-ésima componente. Além disso, quando k — œ, yr tende ao auto-vetor 
correspondente a A. 
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Prova: Temos por hipótese que: 


Vo = cui + couz +... + Un. (7.8) 
Agora, lembrando que Au; = A;u;, obtemos: 
y = Ay 


ci Au + co Aus +... + cn Aun 
= GALU, + coAguo +... + CG AnUn 


= À aaie ad a 
1 E E A RO 
ya = yı = Ayo 
À 
= ft Aus + ... + cx REA 
1 
A A 
= A lcAÃsu + C2 2 Aila Forre T Cn YAni 
A A 
ANO Aa 
= M E F ca (52) uz + F Cn (52) 3 , 
yk = Ayrı = Ay 
A \ AA 
= Ak C1U1 + co (>) to ass SP Cn (5º) 3 
1 1 
Desde que, por hipótese, |M| > JA2| > ... > [An], temos então para i = 1,...,n que |% 
k 
portanto quando k — oo, (5º) 0. 
Logo, o vetor: 
p p 
era F co (>) us +... + Cn (5) un 7 
A A 
converge para cu que é um múltiplo do auto-vetor correspondente ao auto-valor A1. 
Assim, Ay é obtido de: 
A+ 
A = lim (uni), = lim ( E vo), P EO i E (7.9) 
k> (Yk), k>œ (Atyo), 


e isso conclui a prova. 

Observe então que, teoricamente, a partir de obtemos o auto-valor de maior valor absoluto de 
uma matriz A. Na prática, para obter Ay, utilizamos o algoritmo dado a seguir. 

A partir de um vetor y;, arbitrário, não nulo, construímos dois outros vetores yk+1 € Zk+1, do seguinte 
modo: 


Zk+1 = Ay 


m E dia Es 
Yk+1 aa e E max | (zet), > 
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ou seja: dado um vetor yo qualquer, não nulo, construímos a sequência: 


z = Ay 
1 1 
y = —à = —Ay 
Qı Qı 
T 
2 = Ay = — Ay 
q 
1 
Y = —22 = A?yo 
(05) 04705) 
1 
23 = Ay = —— A“ yo 
Q12 
1 1 
Yk Z — Zk = — Ay 
Qk Alas Qk 
1 ; 
mm = Ay = AH yo. 
QI 49 Qk 
Assim, para obtermos A, calculamos: 
(zk+1)r no (Ayo), 
im = lm +46 = àl. 
k500 (Yk), k>œ (Ay), 


Observe que podemos garantir que o valor resultante fornece A; desde que obtemos a mesma expressão 
dada por (7.9). Assim, pelo algoritmo, temos que: 


(2k+1), 
ım 
k>oo (Yk), 


= M. (7.10) 


Observações: 


a) No limite, todas as componentes de Dei de (710), tendem a àı. Entretanto, na prática, uma 
k ig 


das componentes converge mais rapidamente do que as outras. Assim, quando uma das compo- 

nentes satisfizer a precisão desejada teremos o auto-valor procurado. Além disso, a velocidade de 

convergência depende de Ae, Portanto, quanto maior for |A| quando comparado com |As|, mais 
1 


rápida será a convergência. 


b) Para obtermos A com uma precisão e, em cada passo calculamos aproximações para A, usando 
(7.10). O teste do erro relativo para cada componente de A, isto é: 


k+1 k 
$a? 


AO 


a 
LE; 


é usado como critério de parada. 


c) Quando todas as componentes de (7.10) forem iguais, então o vetor yx dessa iteração é o auto-vetor 
correspondente ao auto-valor Ay. 


d) Se algum vetor resultar no vetor nulo, o método falha. Tal acontecimento deve ocorrer se as hipóteses 
não foram satisfeitas. 
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e) No Teorema [7.2] é feita a hipótese de cı £ 0. Se cı = 0, então a prova do Teorema [7.2] indica que, 
teoricamente, o vetor yk converge para uz. Entretanto, na prática, para matrizes de ordem n > 3, 
que satisfaçam as demais condições do citado teorema, o método funciona sempre, pois, mesmo que 
o vetor yo não tenha componentes na direção de u1, e desde que o método envolve a cada iteração 
uma divisão, os erros de arredondamento da máquina farão com que yı passe a ter componente 
nessa direção, após uma ou duas iterações. 


Exemplo 7.4 - Usando o método das potências determinar o auto-valor de maior valor absoluto da 
matriz: 


3 0 1 
A | é al; 
4 2 5 
com precisão de 107?. 
Solução: Tomemos yo = (1, 1, 1)*. Temos: 
4 
z2 = Ay=| 6 ; 1 = max| (z1), | = max(|4], 6|, |11|) = 11. 
1 
1 0.3636 2.0908 
y = — 2 = 0.5455 » 22 = Ayı = 3.8182 
Si 1 7.5454 


Podemos então calcular uma la aproximação para M, usando (7.10). Logo: 


T (2) 5.7503 
Mo = e = 6.9995 
Ur 7.5454 
Agora desde que as = max(/2.0908|, |3.8182], |7.5454|} = 7.5454, obtemos: 
0.2771 1.8313 
Y2 = —z2:= | 0.5060 , z3 = Áy2 = | 3.5662 i 
Aa 1 7.1204 
Novamente, obtemos uma nova aproximação para Ay, fazendo: 
a (23) 6.6088 
Y2)r 7.1204 
Calculando então o erro relativo, obtemos: 
Pa (08 
(2) 7 , ? 
Ar Ir 0.13 


o qual possui todas as componentes maiores que 107?. Assim, devemos fazer uma nova iteração. Agora 
desde que «3 = 7.1204, segue que: 


0.2572 1.8256 
y3 = —z3= | 0.5008 |, z4 = Ays = | 3.5160 
a3 1 7.0304 

7.0980 

> e [too 

(y3), 7.0304 
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Novamente, calculando o erro relativo: 


0.069 

REN 

O — 0.004 , 
IAG In 0.013 


vemos que a segunda componente é menor que 1072. Portanto, 


0.2572 
A =7.0208 come<102euw =| 0.5008 | = y3. 
1 


Observações: 


1) E claro que se desejamos À, com precisão maior basta continuar fazendo iterações. 


2) Os auto-valores de 4 são: 1,2 e 7 com auto-vetores: (0.5, 1, —1)*, (—1, 0.5, 1)* e (0.25, 0.5, 1)*, 
respectivamente. 


3) O método das potências deve ser aplicado se o objetivo é determinar o auto-valor de maior valor 
absoluto de uma matriz. A desvantagem desse método é que ele fornece apenas um auto-valor de 
cada vez. Se todos os auto-valores são procurados devemos aplicar outros métodos que são muito 
mais eficientes. 


4) Algumas vezes o maior auto-valor, em módulo, é o mais importante, mas se não é, devemos modificar 
o método. Em alguns problemas, o mais importante é a determinação do auto-valor de menor valor 
absoluto. Para isso dispomos da seguinte estratégia. 


7.4.1 Método da Potência Inversa 


O Método da Potência Inversa é usado para determinar o auto-valor de menor valor absoluto 
e seu correspondente auto-vetor de uma matriz 4. O método é útil na prática, desde que se tenha 
interesse em determinar apenas o auto-valor, de menor módulo, e, que este esteja bem separado dos 
demais. Novamente, o método pode não funcionar caso a matriz A não possua auto-vetores linearmente 
independentes. O método da potência inversa é semelhante ao método das potências, com a diferença 
que agora assumimos: 
Ai > [A2] > ses] > An-l > lAn] ; 


e desejamos determinar An. 

Sabemos que se À é auto-valor de 4, então AT! é auto-valor de 4-1. Além disso, se |A,| é o menor 
auto-valor de 4, então |A, !| é o maior auto-valor de A71. Assim, o método da potência inversa consiste 
em calcular pelo método das potências o auto-valor de maior valor absoluto de 4-1, pois assim teremos 
o menor auto-valor, em módulo, de A. Portanto, dado yr, construímos dois outros vetores yk+1 € Zk41 
da seguinte forma : 


zk41 = Ay 


1 
Url = a das onde Qk+1 = max |(2r+1), | j 


e portanto: 
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Note que na prática não é necessário calcular A-1, pois de: 
=i 
Zk+1 = Ay > Am = Wk, 


e assim resolvemos o sistema usando a Decomposição LU( ver Capítulo 4). Este método é particular- 
mente conveniente desde que as matrizes L e U são independentes de k e portanto basta obtê-las uma 
única vez. 


Exemplo 7.5 - Deteminar o menor auto-valor, em módulo, da matriz: 


A = 


ONN 


1 0 

5 3 : 
1 6 
usando o método da potência inversa. 


Solução: Os auto-valores de A são: Ay = 7.44437, Às = 4.21809 e Às = 1.33754. Portanto o maior 
auto-valor de AT! é pda = = 0.7476, e é esse valor que desejamos encontrar. 
Decompondo 4 em LU, obtemos: 


1 0 0 2 1 0 
L=|ı1 1 0|, U=[04/3 
0 0.25 1 0 0 5.25 


Assim, tomando yo = (1, 1, 1)* em Azı = yo ou seja fazendoLU z1 = yo, segue que: 


0.5715 i 1 
z1 = —0.1429 PRP O = (te 0.5715 » Y1 Z — 21 = —0.2500 
0.1905 a 0.3333 


Resolvendo agora LU z = y1, obtemos: 


0.7024 es 0.7024 
z2 =| —0.4048 Ig dê 1.6192 
0.1230 (g1)r 0.3690 
Agora, as = 0.7024. Continuando o processo, obtemos: 
i 1 0.7377 
Y2 = — 22 = —0.5763 , e de LU z3 = Y2 > 23 = —0.4754 
a2 0.1751 0.1084 
a 0.7377 
> Az! = CÍ = | 0.8249 |. Temos: az= 0.7377, e assim : 
(y2)r 0.6192 
í 1 0.7454 
Ys = —23 = —0.6444 ede LUz4 = y3 > u= —0.4908 
a 0.1469 0.1063 
(24) 0.7454 
=> A = E 0.7617 |. Finalmente, aq = 0.7454, e portanto : 


(y3)r 0.7235 
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i 1 0.7471 
vu = —2z24= —0.6584 ede LUz5 = y4 25 = 0.4942 ; 
4 0.1426 0.1061 
(25) 0.7471 
> Az! = CO = | 0.7506 
(ya) 0.7443 


Logo A31 = 0.7471 é o auto-valor de maior valor absoluto de 4-1. Portanto A = 1.3385 é o 


3 
auto-valor de menor valor absoluto de A. 


7.4.2 Método das Potências com Deslocamento 
Suponha agora que A tem auto-valores A;, reais, com 
A > A2 > A3 >... D> Ap 1 > An. 


e considere a sequência de vetores definida por: 


mm = (A-—qI)yk 
1 
W = + onde ak = E [Cr 1), |> 


onde T é a matriz identidade de ordem n e q é um parâmetro qualquer. Isto é chamado Método das 
Potências com Deslocamento, porque A — qI tem auto-valores À; — q, isto é, os auto-valores de A são 
deslocados q unidades na reta real. Os auto-vetores de A — qI são os mesmos da matriz A. 

Portanto o Teorema[7.2] pode ser aplicado à matriz A — ql, e pode ser mostrado que ypg converge para 
o auto-vetor correspondente àquele que maximiza |A; — q|. Portanto se: 


A +À - . Zk 

q < Dr então Yk > ue lim ( er > A —q, 
à +à 2 ; 

q > UP então yk > une lim Cera, 


Assim, a escolha apropriada de q pode ser usada para determinar os dois auto-valores extremos, corres- 
pondendo ao maior e ao menor auto-valor de A. Observe que se q = (A +An)/2 então À — q = — (àn — q), 
e assim A — qI tem dois auto-valores de mesmo módulo, mas de sinais opostos. Neste caso, a sequência 
de vetores oscilará entre dois limites os quais são duas combinações de u1 e uz. 


O auto-valor e o auto-vetor dominante são usualmente calculados tomando um deslocamento zero, 
isto é, o cálculo para determinar À, e u1 são realizados na matriz A, através do método das potências. 
A matriz pode então ser deslocada de À, para estimar o auto-valor An. 


Exemplo 7.6 - Determinar o auto-valor de menor valor absoluto da matriz dada no exemplo[7.4] usando 
o método das potências com deslocamento. 
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Solução: No exemplo[7.4] o auto-valor de maior valor absoluto foi estimado = 7. Assim, para determinar 
o auto-valor de menor valor absoluto, vamos aplicar o método das potências na matriz: 


—4 0 1 
A-TI = 2 -5 2 = A* 
4 2 -2 
1 
Iniciando com yo = | 1 |, obtemos: 
1 
—3 
a = Ay= =1 ; o, = max| (21), |= 4. 
4 
1 —0.75 4.00 
y = — 21 = —0.25 » 22 = Ay = 1.75 
ar 1 —5.50 


Podemos, então, calcular uma primeira aproximação para Aj. Assim: 


(za) —5.33 
XO = r = | -700 
(91), —5.50 
Continuando o processo, obteremos: 
—0.52 3.03 
yig = —0.94 » 220 = A“n9 = 5.71 
1 —5.98 
> 0 = ar- | ss 
(y19),. —5.98 


Assim, podemos concluir que o auto-valor dominante de A* é aproximadamente —5.98 com auto-vetor 
aproximado uj = (—0.52, —0.94, 1)*. Portanto a matriz original possui o mesmo auto-vetor mas seu 
auto-valor é —5.98+ 7.00 = 1.02. A lentidão na convergência neste caso se deve ao fato que os auto-valores 


k 
de A* são: —6,—5 e O e assim a convergência é governada pelo fator: (2) . Compare com o exemplo 


k k 
efrs] onde a razão de convergência é (3) e (15749) , respectivamente. 


Em geral, se yg — u1, então na presença do deslocamento q, a velocidade de convergência depende de: 


Ee 
A —q 


e assim uma escolha adequada de q pode acelerar a convergência. Por exemplo, se A é uma matriz de 


k 
ordem 3, com auto-valores: 5,7 e 10, sem deslocamento a convergência depende de (15) , mas com um 


k 
deslocamento de 6 dependerá de (4) , pois A — 61 tem auto-valores: —1,1 e 4. 
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Portanto, na prática não é trivial encontrar o melhor valor de q, a menos que alguns dos auto-valores 
sejam conhecidos a priori. O método das potências e /ou o método das potências com deslocamento 
devem ser utilizados se apenas um ou dois dos auto-valores são desejados. Se o objetivo é determinar 
mais auto-valores então o método da potência inversa com deslocamento pode ser usado, ou seja, como 
no método da potência inversa, calculamos: 


(A — qD)zu+ = Yk, 


usando a decomposição LU, e assim os auto valores de (A— ql)! serão Er 1 Ji Novamente, o Teorema 
E 


[7.2] pode ser aplicado a (A — ql)! e deduzimos que yp converge para o auto-vetor correspondente ao 


auto-valor que maximiza E 1 q Escolhas adequadas dos valores de q nos permitem determinar todos 
SE 


os auto-valores de A, e não somente aqueles correspondentes aos auto-valores extremos. Assim, se o 
auto-valor próximo a q é A;, então o valor de A; pode ser calculado a partir de: 


e. 
(A; =) * 


onde À; é o auto-valor de (A — q1)-!, obtido pelo método da potência inversa com deslocamento q. 


e 


Exemplo 7.7 - Determinar o segundo maior auto-valor, em valor absoluto, da matriz dada no exemplo 


Solução: Já determinamos dois auto-valores desta matriz: 7 e 1.02 (Exemplos [7.4]e [7.6). Sabemos que 
o traço de uma matriz é igual a soma dos seus auto-valores . Neste exemplo o traço de A é 10 e assim o 
outro auto-valor é aproximadamente 1.98, o qual será tomado como o valor de q na iteração inversa com 
deslocamento. Assim, montamos a matriz: 


102 0 1 
A-— 1.987 = 2 002 2 ; 
4 2 3.02 
e a decompomos no produto LU, onde: 
1 1.02 0 1 
L = 1.9608 1 pU Z 0.02 0.0392 
3.9216 100 1 —4.8216 


Tomando como vetor inicial yọ = (1, 1, 1)*, e resolvendo o sistema linear LU 7 = yo, resulta : 


19.9226 i 1 
z = | —10.1707 | >y = ——z = | —0.5105 
-19.3211 19.9226 —0.9698 
De LU z2 = yı, obtemos: 
50.2356 E 50.2356 
zə = | —25.0940 xXO =2 = | 49.0500 
—50.2403 yı 51.8048 
Agora, 
i —0.9999 
m= oe 4 
Y2 = 50.2403 fiada 
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Fazendo LU z3 = y2, obtemos: 


—50.4088 s 50.4138 
z = 24.1885 | >) =% = | 48.3180 
50.4166 y2 51.4166 


Assim, Až œ 50.41. Portanto, o segundo maior auto-valor, em valor absoluto de A é: 


1 
À» = 1.98 + E 1.9998 . 

Observe que o sucesso do método das potências com deslocamento depende de nossa habilidade em 
obter estimativas precisas para usar no deslocamento. Neste último exemplo, uma estimativa para À» foi 
obtida usando a relação entre o traço da matriz e a soma dos auto-valores. Infelizmente, para matrizes de 
ordem > 3, não é fácil obter valores apropriados para os deslocamentos. Como já dissemos anteriormente, 
se desejamos todos os auto-valores devemos usar outros métodos. 


Exercícios 


7.5 - Determinar o auto-valor de maior valor absoluto e seu correspondente auto-vetor, da matriz: 


1 -1 3 
A = —1 1 3 
3 —3 9 


, calculando apenas a primeira aproximação pelo método das potências. O qua você pode concluir? 


7.6 - Usando o método das potências calcular, o auto-valor de maior valor absoluto e seu correspondente 
auto-vetor, da matriz: 


2 = 0 
A = —1 2 — 
0 — 2 


com precisão de 1072. 


7.7 - Usando o método da potência inversa, calcule o auto-valor de menor valor absoluto da matriz: 


2 Ro 
A = 42 2), 
-2 2 5 


com precisão de 107?. 


7.8 - Sabendo que o auto-valor de maior valor absoluto da matriz: 


é aproximadamente: —5.76849, e que seu correspondente auto-vetor é aproximadamente: (—0.1157, —0.1306, 1)‘, 
calcule os demais auto-valores e correspondentes auto-vetores de A, usando: 


a) o método das potências com deslocamento para obter o menor auto-valor, em valor absoluto, 


b) o método da potência inversa com deslocamento para obter o auto-valor Às. 
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7.5  Auto-Valores de Matrizes Simétricas 


Nessa seção restringiremos nossa atenção para matrizes simétricas de ordem n. Matrizes deste tipo 
possuem auto-valores reais e os auto-vetores são linearmente independentes. O método de Jacobi, que des- 
creveremos mais adiante, é usado para determinar os auto-valores e auto-vetores, de matrizes simétricas, 
através de uma série de transformações similares: 


Apm = DE Alia = 1 2is asa 


onde 4, = A. As matrizes A1, As,... convergem num número infinito de passos para uma matriz diagonal. 
Os auto-valores e auto-vetores são então determinados em virtude do Lema [1.1] ( o qual se aplica tanto 
para matrizes simétricas como para matrizes não simétricas). 

Assim, após m passos do método de Jacobi, obteremos: 


Am+1 = Un! ... Uz DE AGUDO .. Um . 


Portanto, se Am+1 ~ D, segue que os elementos diagonais de Am+1 são aproximações para os auto- 
valores de A e as colunas de V = UU» ...Um são aproximações para os auto-vetores. 


Para descrevermos o método de Jacobi, ( para matrizes simétricas), precisamos de alguns conceitos, 
os quais passamos a considerar agora. Assim: 
Rotação de Jacobi 


Seja A uma matriz simétrica. Uma rotação (p,q) de Jacobi é a operação UtAU com U dada por 
(1.23). Observe que fazer uma rotação de Jacobi é efetuar uma transformação de semelhança na matriz A. 


Para um melhor entendimento, consideremos inicialmente, uma rotação (2,4) de Jacobi, em uma 
matriz A de ordem 4. Efetuando o produto U* A, obtemos: 


1 0 0 0 Q11 Q12 Q13 Q14 
UtA = O cosy O -seny a21 Q22 Q23 Q24 
0 0 1 0 a31 Q32 Q33 434 
O senp O coso Q41 Q42 Q43 Q44 
a11 a12 a13 a14 
= Q21C — 4418 Q22C— Q425 Q23C— Q435 Q24C— Q445 
= a31 a32 a33 a34 


Q218 — Q41C Q228 + q49€ Q238 — Q43C Q248 — Q44C 


= A'= (a;;), onde cos p =ce sen g= s. 


Fazendo agora o produto A'U, segue que: 


, 1 1 1 
Q1 d2 13 dig 1 0 0 
, 1 , f 
AU = a21 do» do Q24 O cosy O seng 
ni £ 1 1 , 
a31 Q32 33 34 0 0 1 0 
i ; ý 0 —sen 0 cos 
a41 Q42 Q43 Q44 Sen p p 
1 t 1 1 1 1 
Qi Qi2C— Qji45S Qi3 QoS T Q14 
1 , 1 , A 1 
— Q21 Q22C— Q245 dos Q228 T Q24C = A" = (a!) 
= 1 À =pl 1 1 da! ns = ij? ` 
a31 Q32C— Q345 Q33 Q328 T 034C 
1 r 1 1 T 1 
Q41 Q42 Q445 Q43 Q425 T Q44C 
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Assim, de um modo geral, para uma matriz de ordem n o produto U'A, fornece uma matriz A’, onde: 


pj = apj COS P — ag; SEN Y , I<j<n, 
aj = apj SEN P + agj COS Y , 1<j<n, 
; : f 

Qij = ij , tE Pg I<j<n. 


e o produto A'U fornece uma matriz A”, onde: 


i — £ 4 > $ 
ip © Qip COS P — Aig SEN P , iIin, 
A aa i EA x $ 
Cia = Qip SEN P + Gg COS Y , 1<4<n, 
1 Si A ig . ï 
Qij = Cj; jfpa, i<i<n 


Portanto, a matriz A” tem a seguinte forma: 


A! = : : 
Oe Q- sed 
p q 


(7.11) 


(7.12) 


isto é, na matriz A” apenas os elementos das linhas e colunas p e q serão alterados, sendo que os 


elementos app, Gpa; Gap; Aqq Serão transformados duas vezes. Portanto A” continua simétrica. 


Vejamos agora as fórmulas que determinam a passagem de A — A”, denominada Rotação de Jacobi 


de um ângulo y para os elementos da interseção. Temos, utilizando (7.12) e (7.11), que: 


, 


non , o 
1) app = app COS Y Apg SEN P 
= (app COS P — aqp SEN p) cos p — 
— (apq COS P — aqq SEN P) sen q. 
Portanto: 
PE me 2 2 
App = App COS P — 2apq SEN P COS P + aq SENI q. 
n — t TA 
2) aq = ayp SENP + ayq COS P 
= (app SENP + aqp COS p) sen p + 
+ (apq SEN P — aqq COS P) cos Q . 
Logo: 
IE ca 2 2 
aq = app Sen” Pp + 2apq SEN p COS P + ag COS? Y. 
A E F 1 
3) apg = App SENP + Apg COS P 
= (app COS P — aqp SEN p) sen p + 
+ (apq COS p — aqq SEN p) cos q. 
Assim: 
P os ao = ( ) Ea ( 2 2 ) 
apq = agp = (app — Aag)sen p cos p + apq (cost p — sen” p). 


(7.13) 


(7.14) 


(7.15) 


Portanto, para fazer uma rotação (p, q)de Jacobi, usamos as fórmulas: (7.13), (7.14), (7.15), (7.12) 


com jp,ge (7.11) com i £ p,q. 
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Exemplo 7.8 - Considere a matriz: 


a CO Ha A] 


p= O O =e 


Fazer uma rotação de p = 5 em torno do elemento (p,q) = (1,3). 
2 


Solução: Temos: 


cosp = 


cos 90° = 0 


senp = sen90° = 1. 


Agora, utilizando as fórmulas anteriores, obtemos: 


de (7.7) > «4 = an @ — 2a13 s c+ a33 3 = a33 =3, 


de (7.8) = azs 


a11 s? + 2013 sc+as3 e = an =2, 


de (7.9) a13 am = (a11 — a33) 5 c+ a3 (@ — 8°) = —a13 = —3 . 


Usando e (7.11), segue que: 


1 1 
o = Go = Q12 C — Q32 
1 1 
Qiy = Q4 = Q14 C— Q34 
1 1 
a32 = a32 = Q12 $ T Q32 
4 1 
ass = Q34 = Q14 S T Q34 
Assim: 
3 1 
A! = 1 0 
—3 1 
0 0 


corresponde a uma rotação de 90° em torno do elemento 


7.5.1 Método Clássico de Jacobi 


H 
s = —a32 = l = a51 , 
ZA 
s=-ag4=0=a,; 
— =] = MA 
c = Q12 = L = Q23 , 


c= a14 = 1 = al . 


-3 0 
10 
21 : 
1 1 
(1,3). 
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O Método Clássico de Jacobi, ou simplesmente Método de Jacobi, como já dissemos, é um 
método numérico que serve para determinar auto-valores e auto-vetores de matrizes simétricas. Dada a 


matriz A, efetuamos uma sequência de rotações: 


A =A; A= Ut AU, = A3 = Us As Us =+ 


= aap Eh Akı = Uf Ak Uk =D, 


onde U;, i = 1,2...k são matrizes de rotação, e D é uma matriz diagonal. 


O processo para construção da matriz As, consiste em escolhermos entre os elementos não diagonais 


de A o elemento de maior valor absoluto, isto é: 


apq = max(ai;) = 
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Fazer então, uma rotação com a finalidade de zerar o elemento apq. A seguir reaplicamos o processo 
à matriz resultante tantas vezes quantas forem necessárias, de tal modo a reduzirmos a matriz À a uma 
matriz diagonal D, cujos elementos são os auto-valores de A. 


Assim, no primeiro passo devemos zerar o elemento apq. Assumimos que apq # 0, (pois caso contrário 
nada teríamos a fazer), e assim nosso objetivo é obter ag, = 0. De (7.15), temos a expressão para aj, € 


pq 
impondo que o mesmo seja identicamente nulo, segue que: 


(app — aqq) cos p sen p + apa(cos? p — sen? q) =0. 
SE RE 


isenZy cos2y 
Portanto: 
Apa COS 2 p 
App — Gaga = pI 3 = 2 apq cotg 2 p 
5 sen p 
s cotg2p = W g, 
2 apq 
Agora: 
— cos2o _ cos? — seng _ 
cotg2p = sen2y — 2senpcosp — 
cos? p — sen? q 
o cos? q _ l-t? 
E 2 senp cosy — 2tgp ' 
cos? y 
Seja t = tg y; temos cotg 2 p = q. Assim: 
1- t? 
= > 1-ť = Hg. 
$= ó 


Portanto: 


—2 p+ 42 +4 


2 


Obtemos então: t = —¢ + 4º + 1. Multiplicando o numerador e o denominador por: $+ 92 + 1 
segue que: 


P + 2ġ-1=0 >> t= 


eg o 
ot 39241 
Computacionalmente, adotamos: 
—1 , 90; 
se o+ Sinal(d) 42 + 1 
1, 4 =0. 


Observe que escolhemos o sinal positivo ou negativo de à de modo a obter o denominador de maior 
módulo, pois assim teremos sempre |t| < 1. Agora, temos as seguintes fórmulas para a secante de um 
ângulo q: 


1 
se? p -1+tg py, e, se p= os 
cos? p 
Assim: 
: I+Htg p > cos : 
= 1+ cos = ———. 
cos? p IP á 1+ tg? p 
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Logo, podemos escrever: 


1 1 
c = Coso = = , 
vl+tg? q vi +e 
t 
s = seny = cosp:t = 


VI+ 
Resumindo, o método de Jacobi, consiste em: 


1) Determinar o elemento de maior módulo de A fora da diagonal. Esse elemento será denotado por 
apq- 


2) Calcular: 


Agqa — aA 
2.1) 9 = See, 


pq 
1 
, 0 ; 
o + Sinal(d) 42 +1 dia 
2.2) t = 
1, ER 
1 
2. o A 
3) cos y JFE 
2.4) sen y = t 


vi+e 
3) Usar as fórmulas de rotação de Jacobi, isto é: as fórmulas: (7.13), (7.14), (7.6) com j # p,q 
e (7.5) com i £ p,q. 


O processo deve ser repetido até obtermos uma matriz diagonal. 


Observe que em cada passo k, o item 3) acima pode ser substituído pelo produto Uj. AU, 


Cálculo dos Auto-Vetores 


Ao mesmo tempo que calculamos os auto-valores de uma matriz À pelo método de Jacobi podemos 
obter seus auto-vetores. Vimos que a sequência de matrizes Ay é calculada por recorrência através de: 


Ar = Uf Au, (k=1,2,...). 
Como A, = A, obtemos: 
Aja = VÊ U{t_... UŻU} A Da aaa = V*AV, 


onde V = U,Us ... Uk—1Uk. 

Com a hipótese que A, ~ D obtemos que D = V'AV, onde V é matriz ortogonal, pois a matriz V é 
produto de matrizes ortogonais. Assim D contém os auto-valores de A e V contém seus corresponden- 
tes auto-vetores (em colunas), isto é, a j-ésima coluna de V é o auto-vetor correspondente ao auto-valor Aj. 


Observe que em cada passo do método de Jacobi, um par de elementos fora da diagonal torna-se zero. 
Assim pode parecer, à primeira vista, que uma matriz diagonal é obtida após um número finito de passos. 
Entretanto, isso não é verdade porque transformações ortogonais subsequentes destroem os zeros criados 
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anteriormente. Apesar disso, é possível mostrar que quando um zero é criado nas posições (p,q) e (q, p), 
a soma dos quadrados dos elementos não diagonais da matriz A, S(Ay), decresce de 205º De fato, seja: 


Vamos mostrar que S(Ax) — 0. Para tanto, em cada passo 4 — A” vamos comparar S(A) com 
S(A'). Assim: 


SA) = 5 (tY ap) 


1,9=1 4=1 
i,JÉP, ifp,q 
+ (at AO ag)? + lag)’ + Aa'pa)?, 
sépia 


onde as somas do lado direito da expressão acima representam, respectivamente: os elementos que não 
mudam, os elementos das linhas p e q, fora da diagonal; elementos das colunas p e q, fora da diagonal. 
Agora, usando (??), segue que: 


(asp)? + (ag)? = (aipe Gigs)? + (aips aigc)? = (aip)? + (arg)? , 


m 


e desde que o mesmo é válido para (aj)? + (al;)?, obtemos: 


S(A”) = S(A) — Aapa)? + 2at)? . 


Observe que na expressão acima devemos subtrair 2(apy)?, pois S(A) contém este elemento. Assim, 
de um modo geral, no k-ésimo passo, teremos: 


Sk = Se 1— Bla + Zi) 


= Sk-1-— Alan 1)? j 
desde que (af! 
todos os elementos, fora da diagonal principal, por akz t), obtemos: 


) é o maior elemento, em módulo, fora da diagonal principal e akg = 0. Substituindo 


Ski < (n? — n) (a571)? 


pq 
Sk- 
k—152 k—1 
=> 
(a) <S OEA 
Logo: 
Sp 
Sk < Se1—2 i 1 
n2?-n 


A partir desta expressão para Sk, podemos escrever que: 


2 g e? 
k< |l- Sk-ı <S |1- O A e E E 
nº—n nº—n 
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do ah 
s< (1- E ) So , 
n2?-=n 


onde So, representa a soma dos quadrados dos elementos não diagonais da matriz dada. Agora desde 


e assim, concluímos que: 


que (1 — aê -) < 1, segue que Sk — 0 quando k > oo, e isto signufica que 4 > D, quando k > oo. 


Com isso, acabamos de mostrar que o método de Jacobi é convergente para qualquer matriz real simétrica. 


Observe ainda que, na prática, não obtemos, em geral uma matriz diagonal, mas sim uma matriz 
quase diagonal, ou seja, desde que: Sk-, < (n? — m)(ak!)2 < n?(af;!)2, paramos o processo quando 
njaka < e, onde € é uma precisão pré-fixada. A seguir daremos alguns exemplos. 


Exemplo 7.9 - Determinar os auto-valores e correspondentes auto-vetores de: 
7 2 
faa 


Solução: Como a matriz é 2 x 2 para diagonalizar A devemos zerar o elemento (1,2). Assim: (p,q) = 
(1,2). Temos então que: 


pelo método de Jacobi. 


Q22 — Q11 


2a12 
Portanto: Va 
1 2 
= is = 0.7071 
c v1 + 12 2. A 
s = o txe sa 0.7071 , 
a = ane == Z2a128c + a228? 
= 7(0.5)— 2(2)(0.7071)(0.7071) + 7(0.5) = 5, 
alo = 18? + 2a198c+ a22? 


= 7(0.5) + 2(2)(0.7071) (0.7071) + 7(0.5) 


onde utilizamos as fórmulas: g e rap Assim: 44 = ( , i ) i 


Logo os auto-valores de 4 são: À = 9; A2 = 9 e desde que: 


II 
o 


cos ne] o ( 0.7071 -A 


V=0 = ( a A —0.7071 0.7071 


os auto-vetores, correspondentes, são: 
= 0.7071 o 0.7071 
“1 = | 0.7071 192 = (0.7071 j ` 
Exemplo 7.10 - Determinar, usando o método de Jacobi, os auto-valores da matriz: 


4 2 0 
A = 2 5 3 
03 6 
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Solução: O maior elemento, em módulo, fora da diagonal principal da matriz 44 = A, é o elemento 
aos = 432 = 3. Assim: 


a33 — Q22 6-5 
= = = 0.1667. 
já 293 6 


Portanto, t = 0.8471, cosy = c = 0.7630, seny = s = 0.6464. Como já dissemos podemos ou aplicar 


as fórmulas: (7.13), (7.14), (7.6) com j # 2,3 e (7.5) com i Æ 2,3, ou simplesmente efetuar o produto 
Ut AU, para obter As, onde: 


1 0 0 4 1.5260 1.2928 
U =| 0 0.7630 0.6464 > Á= | 1.5260 2.4586 0 
O —0.6464 0.7630 1.2928 0 8.5414 


O elemento de maior valor absoluto, na matriz A> é aj» = ası = 1.5260. Assim: 


q = —0.5050, t= —0.6153, c= 0.8517, s= —0.5240 . 
Obtemos, então: 
0.8517 —0.5240 0 4.9387 0 1.1011 
U> = | 0.5240 0.8517 0 > Ag= 0 1.5197 —0.6774 
0 0 1 1.1011 —0.6774 8.5414 


Agora (p,q) = (1,3), 4 = 1.6360, t = 0.2814, c = 0.9626, s = 0.2709, e com isso obtemos: 


0.9626 0 0.2709 4.6611 0.1239 0 
Us = 0 1 0 > A4,= | 0.1239 1.5197 —0.6520 
—0.2709 0 0.9626 0 —0.6520 8.8536 


Temos (p,q) = (2,3) e assim afetuando os cálculos segue que: é = —5.6266, t = —0.0882, c = 
0.9961, s = —0.0879. Portanto: 


1 0 0 4.6228 0.1827 —0.0161 
U4 = | 0 0.9961 —0.0879 > Á5;= 0.1827 1.4621 0 
O —0.0879 0.9961 —0.0161 0 8.9081 


Observe que os elementos não diagonais da sequência A, — 0, à medida que k aumenta. Assim os ele- 
mentos diagonais da sequência Ap convergem para os auto-valores de A que são: 1.45163, 4.63951, 8.90885. 
Uma precisão maior pode ser obtida continuando o processo. Além disso, se desejarmos uma aproximação 
para os auto-vetores, basta efetuar o produto U1U2U3U4. 


7.5.2 Método Cíclico de Jacobi 


A procura do elemento de maior módulo, fora da diagonal principal, a cada passo do método de 
Jacobi, é um processo caro que deve ser evitado. Uma alternativa é percorrer ciclicamente os elementos 
fora da diagonal principal, por linha, por exemplo. Assim, sucessivamente, zeramos os elementos das 
posições: 


(1,2) (1,3) (Ln) 
(2,3) (2,n) 
(n— 1,n) 


escolhendo em cada passo ọ tal que apq = 0. As fórmulas usadas são as mesmas do método de Jacobi. 
A seguir voltamos à primeira linha, segunda linha, etc, isto é, repetimos o ciclo tantas vezes quantas 
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forem necessárias até obtermos uma matriz diagonal. Além disso, desde que os elementos não diagonais, 
a cada passo, decrescem podemos usar uma estratégia conhecida como Método Cíclico de Jacobi 
com Dados de Entrada. Tal método consiste em omitir transformações sobre elementos cujo valor, em 
módulo, é menor que os valores fornecidos como dados de entrada. A vantagem deste método é que zeros 
são criados apenas nas posições onde o valor é em módulo maior que os valores fornecidos nos dados de 
entrada, sem a necessidade de ir zerando todos os elementos. O próximo exemplo ilustra esse método. 


Exemplo 7.11 - Determinar os auto-valores e correspondentes auto-vetores da matriz: 


3 04 5 
A=[04 4 01 |, 
5 01 -2 


usando o método de Jacobi, tomando como dados de entrada para o primeiro e segundo ciclos: 0.5 e 0.05, 
respectivamente. 


Solução: Para o primeiro ciclo a transformação sobre o elemento (1,2) será omitida pois |0.4| < 0.5. 
Portanto, desde que |5| > 0.5, um zero será criado na posição (1,3). Assim, fazendo os cálculos, obtemos: 


0.8507 0 —0.5257 6.0902 0.3928 0 
Ui = 0 1 0 > AÁ = 0.3928 4 —0.1252 
0.5257 O 0.8507 0 —0.1252 —5.0902 


A transformação (2,3) será omitida porque | — 0.1252| < 0.5. Isto completa o primeiro ciclo. Para o 
segundo ciclo um zero será criado na posição (1,2) porque |0.3928| > 0.05. Portanto: 


0.9839 —0.1788 0 6.1616 0 —0.0224 
U, = 0.1788 0.9839 0 > A = 0 3.9286 —0.1232 
0 0 1 —0.0224 —0.1232 —5.0902 


A transformação (1,3) será omitida pois |—0.0224| < 0.05. Finalmente um zero será criado na posição 
(2,3). Assim: 


1 0 0 6.1616 0.0003 —0.0224 
Us = O 0.9999 0.0137 > Á, = 0.0003 3.9303 0 
O —0.0137 0.9999 —0.0024 0 —5.0919 


e portanto podemos dizer que os auto-valores de A são aproximadamente iguais a 6.1616, 3.9303 e —5.0919. 
Agora, para obtermos os auto-vetores calculamos o produto U1U2U3. Fazendo isso, segue que: 


0.8370 —0.1449 —0.5277 
UıU2U3 = 0.1788 0.9838 0.0135 
0.5172 —0.1056 0.8439 


Portanto os auto-vetores aproximados de A, correspondentes aos auto-valores aproximados: 6.1616, 3.9303 
e —5.0919, são: 


0.8370 —0.1449 —0.5277 
0.1788 ; 0.9838 i 0.0135 
0.5172 —0.1056 0.8439 


Os auto-valores de A são: 6.16161, 3.93029 e —5.09190. 
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Observe que os teoremas de Gerschgorin (Teorema [1.10) fornecem ainda um limitante para os erros 
cometidos nos auto-valores calculados pelo método de Jacobi. No exemplo os círculos de Gerschgorin 
da matriz transformada A4 são dados por: 


a = 61616, rı = 00227, 
a = 3.9303, rz = 0.0003, 
as = 50919, r; = 0.0224. 


Estes círculos são isolados e assim existe exatamente um auto-valor em cada círculo. Os auto-valores 
podem portanto serem estimados por: 


6.1616 + 0.0227 , 3.9303 + 0.0003 , —5.0919 + 0.0224 


De um modo geral, se os elementos não diagonais de uma matriz n x n simétrica têm módulo não 
excedendo e então, desde que os círculos de Gerschgorin são isolados, os auto-valores diferem dos elementos 
da diagonal principal por no máximo (n — 1)e. 


Exercícios 


7.9 - Determine os auto-valores e auto-vetores das seguintes matrizes: 


10 -6 —4 2 4 -2 
A=[-6 1 2 |, B= 42 2 |, 
42 6 -2 2 5 


usando: 
a) o método de Jacobi, 
b) o método cíclico de Jacobi, 


c) o método cíclico de Jacobi, com dados de entrada igual a 107º para o i-ésimo ciclo. 


7.10 - Se: 
cosp 0 seny 5 0 1 
U = 0 1 0 ; A= 0 —-3 01 ; 
—senp O cosy 101 2 
calcule UAU, e deduza que se ġ = -3 então os elementos (1,3) e (3,1) deste produto são iguais a zero. 


Escreva aproximações para os auto-valores e auto-vetores de A. Use o teorema de Gerschgorin para obter 
um limite superior do erro nos auto-valores estimados. 


7.6 Método de Rutishauser (ou Método LR) 


O método de Rutishauser ou Método LR permite, sob certas condições, determinar todos os 
auto-valores de uma matriz, sem determinar o polinômio característico. 


Seja A uma matriz quadrada de ordem n. O método consiste em construir uma sequência de matrizes 
A1, As,... do seguinte modo: decompomos A = A; no produto Lı Rı onde Lı é triangular inferior com 
1 na diagonal e R; é triangular superior. (Decomposição LU, Capítulo 4). Então, 44 = Lı Rı. Agora, 
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multiplicamos as duas matrizes na ordem inversa e formamos a matriz As = RıLı, e decompomos, a 
seguir, a matriz A> no produto de duas matrizes triangulares Lə e Ro e assim por diante. Então temos: 


A = A= L Rı 


A = Rili= Lə Rə 
A3 = = RoLo = = L3 R3 


Ap = Rk—-1Lk-1 = LiRk 


Observações: 


1) Pode-se provar que: Se os auto-valores de A são distintos a sequência {Ap} converge para uma 
matriz triangular superior R. 


2) As matrizes A e R são matrizes similares. De fato, temos: 4, = Lı Rı > Li 1 A; = R,, então: 


As = Ril; = L'AL , 


desde que Aı = 4. Portanto Aə é similar a 4. De 44 = LoR, > L3 1 A> = Ro, então: 


As = RoLo = L3 'AoLo = L3 LIAL Lo , 


e portanto As é similar a A. De um modo geral, obtemos: 


Ar = Re-iLp-1 = Lt. LI} AI... Lp os 
DA 


Portanto A, é similar a A. Logo possuem o mesmo polinômio característico. Portanto possuem os 
mesmos auto-valores. 


3) Os elementos diagonais da matriz Ay são os auto-valores procurados. 


4) O processo termina quando o elemento de maior valor absoluto da matriz Ay, (abaixo da diagonal 
principal), for menor que €, onde € é uma precisão pré-fixada. 
Exemplo 7.12 - Calcular os auto-valores de: 


2 0 1 
A=|[0 10 
1 0 1 


pelo método de Rutishauser com precisão de 1072. 
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Solução: Temos: 


1 2 0 1 
Ay = A = (0) 1 1 0 E LU, , 
0.5 0 1 0.5 
25 0 1 
A = UL, = 0 1 0 
0.25 0 0.5 
1 25 0 1 
Z 0 1 1 0 = Lol», 
01 0 1 0.4 
26 0 1 
äs o dee o cio 
0.04 0 04 
1 26 0 1 
= 0 1 1 0 = L3Us, 
0.0154 0 1 0.3846 


26154 0 1 
Ac TIE 0 1 0 
0.00592 0 0.3846 


Como os elementos abaixo da diagonal principal de A4 são, em módulo menor que 107? => A4 œ R. 
Assim, os auto-valores de A são: 


M ~ 2.6154 , 
à= l1, 
As = 0.3846, com e< 1072. 


Observe que os auto-valores de A são: 2.618034, 1 e 0.381966. 
O método de Rutishauser permite obter também os auto-vetores. Entretanto o cálculo dos auto- 


vetores, por este método, é um tanto trabalhoso e assim será omitido. O leitor interessado pode encontrar 
a descrição do método, por exemplo em [Fox, 19..]. 


Exercícios 


7.11 - Usando o método LR, determine os auto-valores das matrizes: 


3 0 1 5 1 0 
A = 0 2 2 z B = -1 3 1 f 
125 —2 1 10 
com precisão de 1072. 
7.12 - Considere a matriz: 

5 0 1 
A= O 1 0 
5 0 1 


Usando o método LR, uma única vez, isto é, até determinar As, é possível estimar os auto-valores de 


A? 
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7.7 Método de Francis (ou Método QR) 


O método de Francis ou Método QR determina todos os auto-valores de uma matriz, sem deter- 
minar o polinômio característico. 


Seja A uma matriz quadrada de ordem n. O método consiste em construir uma sequência de matrizes 
Ay, As,... do seguinte modo: decompomos A = A; no produto QıRı onde Qı é ortogonal e Rj é 
triangular superior. Então, 44 = QıRı. Agora, multiplicamos as duas matrizes na ordem inversa e 
formamos a matriz 49 = RıQı, e decompomos, a seguir, a matriz A> no produto Q2Rə e assim por 
diante. Então temos: 


A = A= QR, 
Ao = Qı = QR, 
Ar = Rk-aQk-ı = QkRp o 


Observações: 


a) Essa decomposição tem a vantagem, em relação ao método LR, de sempre existir. Além disso, se As 
é real então Q, e Rs são reais. 


b) A sequência A, converge para uma matriz triangular superior em cuja diagonal encontram-se os 
auto-valores da matriz A. 


c) A matriz A, é similar a matriz A. De fato, temos: 4, = Qı Rı > Or A = Ri, então: 
A = RıQı = Q7'AQ1 
Portanto, desde que A; = A, temos que: A> e A são similares. De um modo geral, obtemos: 


Aa = PRkQk = 0; 0:42:07" A1 Qi... Qr-1Qk 
X jp NE 
Q- Q 


Portanto Ay,1 é similar a A. Logo possuem o mesmo polinômio característico. Portanto possuem 
os mesmos auto-valores. 


d) Os elementos diagonais da matriz Ay são os auto-valores procurados. 


e) O processo termina quando o elemento de maior valor absoluto da matriz A, (abaixo da diagonal 
principal), for menor que e, onde € é uma precisão pré-fixada. 


Em cada passo do método QR, devemos determinar matrizes Qk e Ry onde Qk é matriz ortogonal e 
Ry é matriz triangular superior. Essa decomposição pode ser obtida utilizando transformações ortogonais 
da forma (1.23). A seguir mostramos como isso pode ser feito. 


Seja A uma matriz que desejamos decompor no produto QR. Para zerar o elemento a21, fazemos o 
produto U, A e com isso obtemos uma matriz AMD): para zerar o elemento as, fazemos o produto Uz, A® 
e assim obtemos uma matriz AQ), e assim sucessivamente, isto é, procedemos coluna por coluna. até 
zerarmos todos os elementos abaixo da diagonal principal. O produto das matrizes U!UÍ... fornece a 
matriz Qı. 
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Considere então o produto U, 4, onde U; é dada por (1.23). O elemento aí, é dado por: 
Ap = —Sen Papp + COS Pagp » (7.16) 


e queremos a, = 0. Assim, o que desejamos é 


= py l — cosp + COSYaqgp = O 


= Op yV1L-corp = Qpcosp 
> appl — cosp) = apos p 
> (a2, + aip)cos?y = Dé 

> cosy = “pp 


[42 2 
“pp + Agp 
Por outro lado, igualando (7.18) a zero, segue que: 
= a [12 2 
PP “pp + Agp 


Para melhor entendimento do método, considere uma matriz de ordem 3. Para reduzí-la a forma 
triangular devemos zerar os elementos a21,431 € a32. Assim, fazendo c = cosy e s = seny, segue que: 


1) para zerar o elemento a21, efetuamos o produto: 


r 1 T 
c s 0 Q11 Q12 Q13 a Qi2 @13 
1 1 
—s c 0 Qû21 Q22 Q23 = 0 oo dog ; 
0 0 1 a31 a32 433 a31 Q32 Q33 
Uı 
e desde que queremos a21 = O devemos ter: 


—s a11 + c a21 = 0, onde 


= Q21 


=> e = Ii), 
2 2 2 2 
Va + as vy aii + as 


2) para zerar o elemento a31, efetuamos o produto: 


, £ 1 A 1 MA 

c 0 s Q1 Qi2 13 Q1 diz Q13 

0 10 0 ab» ab = O as, ass 

AA A 

—s 0 c Q31 Q32 33 O as a33 
U2 


e desde que queremos a31 = O, devemos ter: 


— say +c agı = 0, onde 


a31 p 01 


s = 55 e e= — H. 
J72 2 J T2 2 
aji + 031 a11 + a31 
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3) para zerar o elemento a32, efetuamos o produto: 


ZA ZA ZA ZA ZA ZA 

1 0 0 Qi} Qi2 Qig Q1 da Quis 

f 1 Sein [ZA ZA 

0 cs O as, dos = O as ds 

0 —s c O ago a% 0 0 ag 
Us 


e desde que queremos a}, = 0, devemos ter: 


— sao + C ago = 0 


ZA 1 
Q32 = Q22 


s = 2 — e c = — H. 
Ta r2 Va Aae 
Vad + a33 a33 + a33 


Assim, obtemos: 
UUU A = Ri > A= DU Ri. 
= 


Qı 


O produto RıQı = RiUtUSUÍ é obtido por sucessivas pré-multiplicações de R com as matrizes 
PR A 


Exemplo 7.13 - Determinar os auto-valores da matriz: 
2 01 
A = 0 10 
1 0 1 
pelo método de Francis; com e < 1072. 


Solução: Como azı = 0, devemos zerar apenas o elemento agı. Assim Uı = I e para obtermos Us, 
fazemos: 


a31 1 1 


> > s= = 
a?i +a; V22 +12 V5 


a11 
2 


2 
e ras >> o: 
aii T a51 v5 


0.8944 0 0.4472 
U = 0 1 0 
—0.4472 0 0.8944 


Portanto: 
2.2360 0 1.3416 
UU, A = UIA = UA = 0 1 0 
0 O 0.4472 
V—— r cama 
Rı 


Desde que a) =0 = U; = I. Assim: U3U2U; = U e U;! = Ui. Portanto: 


0.8944 0 —0.4472 2,2360 0 1.3416 
A =A= 0 1 0 0 1 0 = Qh. 
0.4472 O 0.8944 0O O 0.4472 


Us 
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Agora: 
2.5998 0 0.2000 
As E RıQı — 0 1 0 
0.2000 O 0.4000 


Aplicando novamente o processo, temos que: U = Us = I. Devemos então determinar U2. Assim: 


0.2000 
= = 0.0767 , 
g V(2:5998)2 + (0.2000)? 
c = 2.5998 = 0.9971 . 
V'(2.5998)2 + (0.2000)? 
Portanto: 
0.9971 0 0.0767 
Ü= 0 1 0 ; 
—0.0767 0 0.9971 
e assim: 
2.6076 0 0.2301 
UzA = 0O 1 0 = Ro 
O 0 0.3935 
Logo: 
0.9971 0 —0.0767 2.6076 0 0.2301 
Äe 0 1 0 o 1 0 = Qə Rə 
0.0767 0 0.9971 O O 0.3835 
S 
U3 
Finalmente, 


2.6177 0 0.0294 
A3 = R Q2 = O 1 0 
0.0094 0 0.3824 


Desde que o maior elemento, em valor absoluto, abaixo da diagonal principal é menor do que 102, 
temos que os valores aproximados dos auto-valores de A são: 2.6177, 1 e 0.3824. Observe que os auto- 
valores de A são: 2.618034, 1 e 0.381966. 


O método QR permite obter também os auto-vetores. Como no método LR o cálculo dos auto-vetores 


é trabalhoso por este método e assim será omitido. O leitor interessado pode encontrar a descrição do 
método, por exemplo em [Fox, 19..). 


Exercícios 


7.13 - Usando o método QR, determinar todos os auto-valores das matrizes: 


A dA =8 12 3 1 
A=ļ|08 bars 2 2 3], 
0 2 = 4 6 2 


com precisão de 1072. 
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7.14 - Usando o método QR, uma única vez, na matriz: 


1 3 
0 1 
1 =] 


A = 


NN Ne 


é possível estimar seus auto-valores? (Use aritmética exata). 


7.8 Exercícios Complementares 


7.15 - Para cada uma das matrizes: 


meto ES AE 5 à l l 
0 2 -1 
encontre um polinômio que tenha a matriz como raiz. 
7.16 - Sabendo que uma matriz de ordem 3 tem como auto-valores À = —1, À = 2, à3 = 3. 
a) Qual é o polinômio característico de A? 
b) Quanto vale tr(A2)? 
c) Quais são os auto-valores de A71? 
d) A matriz A é uma matriz singular? Por quê? 
7.17 - Seja A uma matriz quadrada de ordem n e sejam A1, Ão,--- , An seus auto-valores. Quais são 


os auto-valores de A — qI onde q é uma constante e I é a matriz identidade? 


7.18 - Mostre que se v é auto-vetor de A e de B então v é auto-vetor de aA + BB, onde a, 8 são 
escalares quaisquer. 


7.19 - Mostre que uma matriz A e sua transposta At possuem o mesmo polinômio característico. 
7.20 - Considere a matriz: 
13 
A= 0 0 2 
—1 1 0 
Verifique, através do método de Leverrier, que seu polinômio característico é dado por: 
P(A) =X +A? +3A-8. 
7.21 - Seja a matriz: 


1 0 2 
A=|0 3 1 
212 


a) Verifique pelo método de Leverrier-Faddeev que seu polinômio característico é dado por: 


P(X) = (-1) (Nº — 6A? + 6å + 7) . 
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b) Determine por método numérico a sua escolha o único auto-valor real negativo de A com 
precisão de 1072. 


c) Usando os resultados obtidos em a) e b) calcule o auto-vetor correspondente . 
d) Usando a) obtenha a inversa de A. 


7.22 - Usando o método das potências determine, com precisão de 107°, o auto-valor de maior valor 
absoluto, e seu correspondente auto-vetor, para cada uma das seguintes matrizes: 


3 1 2 2 10 
A=|132|, B=|121 
1 2 3 012 


7.23 - Considere a matriz: 


-1 2 
A=| -1 12 
2 —2 8 
a) Pelo método das potências calcule o auto-valor de maior valor absoluto de A e seu correspon- 
dente auto-vetor. 
b) Obtenha o polinômio caracteristico de A pelo método de Leverrier-Faddeev. 
c Determine os demais auto-valores de A. 
d) Obtenha o auto-vetor correspondente ao auto-valor À» pelo processo de Leverrier - Faddeev. 
Suponha |A| > |As] > |Asl. 
7.24 - Determinar o auto-valor de maior valor absoluto da matriz: 
422 
A=|2 51 
2 1 6 
usando o método das potências. Use como vetor inicial yo = (8/9, 8/9, 1)*. Dê seu valor aproximado 


após três iterações. 


7.25 - Considere as matrizes: 


1-33 
A=( al B=[3 —5 3 
6 —6 4 


Para cada uma delas: 
a) calcule P(X) e suas raízes algebricamente. 
b) calcule P(A) pelo método de Leverrier. 
c) calcule os auto-valores e auto-vetores pelo método de Leverrier-Faddeev. 
d) calcule os auto-valores pelo método de potências. 
e) calcule os auto-valores pelo método LR. 


f) calcule os auto-valores pelo método QR. 
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7.26 - Matrizes do tipo: 
To Tı T2 
T2 To Tı , 
Tı T2 To 


são chamadas matrizes circulantes. Determine todos os auto-valores e correspondentes auto-vetores 
da matriz circulante onde £o = 9, £1 = 2 e x3 = 1, utilizando para isso método numérico a sua escolha. 


7.27 - Localizar, usando o teorema de Gerschgorin, os auto-valores de: 


1 0 2 3 1 0 
A = 0 3 1 2 B= 1 2 1 
2 A? O —1 0 
7.28 - Considere a matriz: 
2 —1 
A= =1 2 —1 
0 —1 2 


Determine os auto-valores de A, usando: 
a) o método clássico de Jacobi, 
b) o método cíclico de Jacobi, 
c) o método cíclico de Jacobi, com dados de entrada igual a 5 x 107º para o i-ésimo ciclo. 


d) Use o teorema de Gerschgorin para obter um limite superior do erro nos auto-valores estima- 


dos. 


7.29 - Considere a matrizes: 


10 —1 0 100 0 99 
A=| + 2 0 , B= 0 20 0 
0 0 1 99 0 101 


a) Caso haja convergência pelo método de Rutishauser, o que se deve esperar? 


b) Determine os auto-valores usando o método de Rutishauser. Use com processo de parada 
e = 102, ou número máximo de iterações = 3. 


7.30 Considere a matriz: 
4 1 1 
A=|2 41 
0 1 4 
Determine os auto-valores de A, com precisão de 107?, usando: 


a) o método LR, 


b) o método QR. 
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7.9 Problemas Aplicados e Projetos 


7.1 - Considere o movimento horizontal do conjunto massa mola mostrado na Figura 7.3. 


Tı T2 
kı k2 k3 
aa mo go; Ma 
O O O O 
Figura 7.3 


As deflexões horizontais xı e x2 são medidas relativamente à posição de equilíbrio estático. As molas 
possuem rigidez kı, k2 e ka, que são as forças requeridas para estender ou comprimir cada mola de uma 
unidade de comprimento. 

As equações de movimento são: 


dx 

mi e = —kızı + ko(xo = zı) 
d&r 

Toa = ko(a1 = z2) + k3£2 


a) Se x = (x1, £2) é o vetor deflexão então podemos reescrever as equações acima na forma: 


b) Mostre que a substituição: 


onde v é um vetor do R? , ®t = coswt + isenwt com i = y/—1 , leva ao problema de auto-valores 


: Av = Av onde à = —w?. Os possíveis valores que w pode assumir são as frequências naturais de 
vibração do sistema. 


c) Se kı = k2 = k3 = 1kg/s? e mı = ma = lkg determine os auto-valores e auto-vetores de À, 
por método numérico “a sua escolha. 


7.2 - Considere o seguinte sistema de equações diferenciais, com coeficientes constantes: 


de = filzgoya.Un) 
de — fole Y1, Vas er, Un) 
do = fa(myyo on) ; (7.17) 


“de = falx, Y1, Y2, Boss Yn) 


Se escrevermos (7.1, na forma: 
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então a solução geral do sistema é dado por: 
n 
Y(t) = DM a i 
k=1 


onde: ck são constantes arbitrárias, Ag são os auto-valores de A e vg seus correspondentes auto-vetores. 


Considere os sistemas: 


dn = 10y dn = —l0yı — Tyo + Tys 
(1) da = y —3y2— Ty , (ID) ci =  Sy +ógyo — 4y3 ) 
cê Ee 22 $ 6y3 Te = Tyi 5y2 + 6y3 


Determine a solução geral destes sistemas, usando um método numérico à sua escolha para determinar 
todos os auto-valores e auto-vetores. Cuidado!! O sistema (II) possui auto-valores iguais em módulo. 


7.3 - A curvatura de uma coluna delgada sujeita a uma carga P pode ser modelada por: 


d? M 
m (7.18) 
dx EI 
2 
onde ay especifica a curvatura, M é o momento de curvatura, E é o módulo de elasticidade, e I é o 
momento de inércia da seção transversal sobre o eixo neutro. Considerando o corpo livre na Figura 7.4-b 
é claro que o momento de curvatura em x é M = — Py. Substituindo esse valor na equação (7.18) resulta: 


dy 


ES 2 — 
da? +pêy 0, (7.19) 
onde p 
2 
"> (7.20) 
P P 
y 


Figura 7.4 
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Para o sistema na Figura 7.4, sujeita às condições de contorno y(0) = y(L) = 0, a solução geral da 


equação é: 


onde A e B são constantes arbitrárias que devem ser obtidas usando-se as condições de contorno. Mostre 
que de y(0) = 0 obtêm-se B=0 e de y(L) = 0 obtêm-se A sen pL = 0. Mas desde que A = 0 representa 
a solução trivial, concluímos que sen pL = 0. Assim, para que esta última igualdade seja válida devemos 
ter: 


y = A sen pz + B cos pz , 


pL = ntr, n=1,2,.... (7.21) 


Portanto, existe um número infinito de valores que satisfazem as condições de contorno. A equação 


(7.21) pode ser resolvida para: 
na 


p= n=133.., (7.22) 


os quais são os auto-valores para a coluna. Cada auto-valor corresponde ao modo nos quais a coluna 


curva-se. Combinando as equações (7.20) e , segue que: 


2—2 
P = na a n=1,2,3,.... 

Isto pode ser entendido como uma deformação da carga porque elas representam os níveis nos quais as 
colunas movimentam-se em cada deformação sucessiva. Na prática, em geral, o auto-valor correspondente 
an = 1 éo de interesse porque a quebra usualmente ocorre quando a primeira coluna se deforma. Assim, 
a carga crítica pode ser definida como: 

T2EI 
PP 

Uma carga sobre uma coluna de madeira possui as seguintes características: E = 10!0 Pa, I = 
1.25x 10-“m!, e L = 3m. Determine o oito primeiros auto-valores, isto é, os auto-valores correspondente 
an=1,2...,8 e suas correspondentes deformações das cargas. Qual o valor obtido para a carga crítica? 


Perit. = 


7.4 - No problema [7.3] foi razoavelmente fácil obter os auto-valores pois era conhecida a expressão 
analítica da solução, o que em geral não acontece na prática. Assim, podemos obter os auto-valores de 
(119), substituindo a derivada segunda pela diferença dividida central, isto é, substituindo ER) por: 


Vir — i + Yi! 


h2 
Fazendo isso, podemos escrever (7.20) como: 
Yi+ı — 2Yi + Vin! 
DE +pyi = 0, 
ou ainda: 
gm — (2 — h? pyi + yi = 0. 


Escrevendo esta equação para uma série de nós ao longo do eixo da coluna, obtêm-se um sistema 
de equações homogêneas. Por exemplo, se a coluna é dividida em cinco segmentos (isto é, quatro nós 
interiores), o resultado é: 


(2-1) q y 
= (Gn q v |o 
1 (Gn) q y | 50 
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Considerando os mesmos dados do problema[7.5) determine os auto-valores para os casos: a) um, b) 
dois, c) três e d) quatro nós interiores, usando método numérico à sua escolha. Lembre-se: desde que 


L=3, segue que para um nó interior h = > para dois nós interiores h = 3, etc. 


7.5 - No probema[7.4] para três nós interiores você obteve o seguinte sistema: 


(2 — 0.5625p?) —1 yı 
-1 (2 — 0.5625p?) ai y | = du 
—1 (2 — 0.5625p?) Y3 


a) Mostre que dividindo cada equação por h2, obtêm-se: 


3.556-A 1.778 
(A-AT) = —1.778 3.556-A 1.778 
—1.778 3.556 — À 


onde À = p°, e que a expansão do determinante fornece: 


P(A) = —A°? + 10.667)? — 31.607) + 22.487 . 


b) Mostre que o mesmo polinômio pode ser obtido aplicando-se o método de Leverrier-Faddeev 
à matriz: 


3.556 —1.778 
B = —1.778 3.556 —1.778 
—1.778 3.556 


c) Usando o polinômio característico obtido em b), determine os auto-valores de B, usando 
método numérico à sua escolha. 


d) Usando o método de Jacobi, determine os auto-valores e auto-vetores da matriz B. 


Capítulo 8 


Aproximação de Funções: Método 
dos Mínimos Quadrados 


8.1 Introdução 


O objetivo do presente capítulo consiste em resolver o seguinte problema: aproximar uma função 
y = f(x) (real e de variável real) por uma função F(x) que seja combinação linear de funções conhecidas, 
isto é: 
fla) = ao golx) + a gl£) + ... + am Gmlx) = Fla). 


de tal modo que a distância de f(x) a F(x) seja a menor possível. 


A substituição de f(x) por uma função F(x) é indicada quando o uso da função dada oferece alguns 
inconvenientes, tais como: 


a) f(x) é definida através de processos não-finitos como integrais, soma de séries, etc; 


b) f(x) é conhecida através de pares de pontos, obtidos em experimentos, e desejamos substituí- 
la por uma função cujo gráfico se ajuste aos pontos observados; 


que podem ser afastados através de uma escolha apropriada da função F(x). 
Antes de descrevermos o método do mínimos quadrados relembremos alguns conceitos básicos. 


Sabemos da geometria plana euclidiana que: dados uma reta r e um ponto P fora dela, o ponto da 
reta r mais próximo de P é o único ponto Q tal que PQ é ortogonal a r. 


O mesmo acontece na geometria euclidiana sólida, isto é: dados um plano a e um ponto P fora dele, 
o ponto de a mais próximo de P é o pé da perpendicular traçada de Pa a. 


Como generalizar tal idéia a um espaço euclidiano E qualquer? O problema que devemos resolver 
agora é: dados uma função f(x) € E e um sub-espaço E” de E qual deve ser a função F(x) € E”, tal que: 


| Hx) — Fa) ||<I| (x) — Q) |l, 


para qualquer que seja Q(x) € E”, Q(x) £ F(x)? 
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Este problema pode ser resolvido através da aproximação de f(x) por F(x) pelo Método dos 
Mínimos Quadrados, como veremos nesse capítulo. 


8.2 Aproximação Polinomial 

Vamos tratar aqui da aproximação de uma função y = f(x) por um polinômio de um certo grau m, 
isto é, F(x) = Pm(x), tanto no caso em que f(x) € Cla,b], onde C[a,b] é o espaço vetorial das funções 
contínuas reais definidas no intervalo fechado e limitado [a,b] (caso contínuo), como no caso onde f(x) é 
dada por pares de pontos (caso discreto). 


8.2.1 Caso Contínuo 


Consideremos uma função f(x) € Cla, b]. 


Inicialmente analisaremos o problema considerando que o polinômio a ser determinado seja escrito 
em relação à base canônica e a seguir que ele seja escrito em relação a uma base ortonormal. Assim: 


Representação na Base Canônica 
Desejamos aproximar f(x), x € [a,b], por um polinômio de grau no máximo m, isto é, 


fla)=za +azx+t..tamai” = Pala), 


de tal modo que a distância de f a Pm seja mínima. 
Observe que neste caso: go(x) = 1, gala) =, ..., Gm(x) = x” são funções conhecidas. 
Assim, o polinômio (a coeficientes reais), P(x), deve ser tal que: 
dist (f, Pm) = mínima. 
Usando a definição de distância, dada anteriormente, (Capítulo 1), temos: 
dist(f,Pm) = ES BA = [f— Pas f =P 


1/2 


b 
| / (x) - Pale)? del = Ilf- Pall? - 


I 


Assim, o que desejamos é obter: 


Q = ||f-Pal? = mínima , 


(daí a justificativa para o nome mínimos quadrados). 
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Precisamos, então, determinar na classe de todos os polinômios de grau menor ou igual a m aquele 
que minimize: 


b 
Q =| f- Pa|? = / (la) — Palo)? de 


Sabemos, entretanto, que os polinômios de grau < m constituem um espaço vetorial K,(x), do qual 
{1, £, £?,...,£™} é uma base. E mais: Km(£), para x € [a,b], é um sub-espaço de Cla, b]. 


Se nos lembrarmos de projeção ortogonal de um vetor sobre um sub-espaço, (Capítulo 1), o nosso 
problema está resolvido, pois, a distância de f a Pm será mínima quando P, for a projeção ortogonal de 


f sobre Kn(x). 


Resumindo: para aproximar f € C[a,b] por um polinômio P(x) de grau no máximo m, basta 


determinar a projeção ortogonal de f sobre K,(x), o qual é gerado por (1,x,212,...,a”). 
Portanto os coeficientes ao, a1, ..., am, de Pn(x), são dados pelo sistema normal, isto é: 
(1,1) (el) ...  (z™,1) ao (1,1) 
1,0) (rx) ... (ae) dido, (f, x) 
(Lar) (mem) (amam ) Lo (7,8%) 


A menos que seja sugerido o produto escalar a ser utilizado, usa-se o produto escalar usual de Cla, b], 
isto é, para f,g € Cla, b): 


b 
(19) = i: f(x) g(x) dz. 


Exemplo 8.1 Seja f(x) = xt -5 x, x € [-1,1]. Aproximar f(x) por um polinômio do 2º grau, usando 
o método dos mínimos quadrados. 
Solução: Temos que: f(x) e C|—1,1], e para x € [-1,1], K2(x) é um sub-espaço de C[—1, 1]. Queremos 
então: 

f(x) = P(x) = ao + at + ag, 


onde P(x) deve ser a projeção ortogonal de f sobre Kə(x). Assim a base para Ko(x) é {1, g, x°}. 
Devemos, então, resolver o sistema: 


(1,1) (x,1) (72,1) ao (f,1) 
(1,x) (x,a) (£2, £ ai = (f, £) 
(1,2?) (x, 2°) (28,25) as (f, x?) 


Usando o produto escalar usual de C|—1, 1], segue que: 
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| 
ie 

a 

8 

| 
B, 
i 

| 

N 


a 
“pas 
fee 
N 
x 
II 
m m m 
8, 8 
5 5 
II II 
8 
N 
efs co | a | N 
E E I m 
v ro ani 
a Il 
II 
II 


q z 
(x?, 2°?) = / qtde = z] ="2/5º, 
met 5 aoii 
5 2 1 
= a = vo 5x 
aD = f -saa -= (SEE) 
6 3 
(ho) = f -sed = -F 
7 4 
(F?) = S, (nº — 5 a?) de = -(5-* | 
Assim, obtemos: 
2 0 283 ao 2/5 
O 2/3 0 a | = | -10/3 
2/3 0 2/5 a2 2/7 
cuja solução é: ao = —3/35 ; ai = —5 ; a2 = 6/7. 
Portanto: 
fo) = Pz) = -2 -5s + Êx? 
aTe E TS 
Exercícios 
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(8.1) 


8.1 Seja f(x) = zh x € [-1,1]. Usando o método dos mínimos quadrados, aproximar a função 


f(x) por um polinômio do 2º grau. 


8.2 Seja f(x) = 4, x € [0,1]. Usando o método dos mínimos quadrados, aproximar a função f(x) 


por um polinômio do tipo P(x) = a x? +b zt, usando o seguinte produto escalar: 


(1,9) = I x? f(x) g(x) dz . 


Note que a base do sub-espaço neste caso é: {x?, xf}. 


8.3 Usando o método dos mínimos quadrados, aproximar a função f(x) 


(z3 -1)º , ve [0,1], 
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a) por uma reta; 


b) por um polinômio do 2º grau. 


Observações: 


a) Quem resolveu o último exercício (e quem não resolveu deve fazê-lo), pode observar que para passar 
de um polinômio de grau k para um polinômio de grau k + 1 é necessário que calculemos todos os 
coeficientes do polinômio e não apenas o último, ou seja, devemos refazer praticamente todos os 
cálculos, visto que o sistema linear passa de ordem 2 para ordem 3. 


b) Além disso, para m grande, (m > 5), os efeitos de propagação dos erros de arredondamento, tornam- 
se explosivos, tornando o método tremendamente instável, ou seja, a solução do sistema linear pode 
ser irreal. 


Vejamos então uma maneira de aumentar o grau do polinômio aproximante sem refazer todos os 
cálculos, bem como obter uma solução que realmente tenha significado. 


Representação na Base Ortonormal 


Veremos aqui como ajustar funções pelo método dos mínimos quadrados através de polinômios orto- 
normais. 


Consideremos então em Km(x), uma base (Lj(x), Lij(x)..., Li (x)) de polinômios ortonormais, isto 
é, de polinômios tais que: 


E , 1 , i=j, 
COE O E 7 (8.2) 
Observe que tais polinômios podem ser obtidos ortonormalizando-se a base canônica {1, £, £?,..., £™} 
por Gram-Schmidt, (Capítulo 1). 
A projeção ortogonal de f € Cla,b] sobre K, (x) será então dada por: 
Pm(£) = ao Li(x) + a L(x) +... + am Lilo), 
onde os a;, i = 0,1,...,m, são obtidos resolvendo-se o sistema: 
(L$, 15) (14,13) (Lai) ao (S, L) 
(Lo Li) (L, L7) (Lia LÃ) a (L1) 
. = . (8.3) 
a E e TE a (Lt) 
Mas, em vista de (8.2), (8.3) se reduz a: 
1 0 ... 0 ao (f, Lọ) 
O 1.. 0 aq (f, Lï) 
> : = i (8.4) 
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Agora a solução de (8.4) segue trivialmente, isto é: 


ai =(LL) , i=0,1,...,m. (8.5) 
Observe que se ao invés de uma base ortonormal, considerássemos uma base L;(x), i = 0,1,...,m, 
ortogonal, cada a;, i = 0,1,...,m, seria dado por: 
a; = (f; Li) 
' (Lis Li) 


Temos então obtido Pm(x) que aproxima f(x). Se agora quisermos aproximar f(x) não só por Pn(a) 
mas também por P-,1(x:), devemos projetar f(x) também sobre Km+1(x£) D Kn(a). 


Assim, uma base ortonormal para Km+1 será a base de Km (x) adicionada de Lj ,(x) (ortonormal a 
Li(a), i=0,1,2,...,m). 


A projeção de f(x) sobre Km1(x) será: 


Pm+1 = ao Lolz) + a Liz) + ... + am Late) + amy Lose): 


onde os a; são dados por (8.5), inclusive am+1, Isto é, 
ai = (f, Iž) , i=0,1,...,m+1. 


Observamos então que, uma vez obtido Pm(x), basta calcularmos Lj (x) e a@m+1 para obter 
Email (a). 


O processo pode ser repetido param +2,m +3,.... 


Exemplo 8.2 - Aproximar a função f(x) = zt -5 z, x € [11], 
a) por uma reta, 
b) por uma parábola, 


usando polinômios ortonormais. 


Solução: A aproximação de f(x) por uma reta será dada por: 
fla) = ao F(s) + a Pilx) = Q(x), 
e então a aproximação por uma parábola será obtida fazendo: 
fla) = Qıl) + a2P3(£) = Q2(2). 


Devemos primeiramente construir os P;(x) (ortogonais) utilizando o processo de Gram-Schmidt a 
partir de {1, x, x°}, (veja Capítulo 1). 
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Do (Exemplo 1.14), temos que: 


Po(z) = 1, 
P(x) = z, 
Pla) = -4 


Ortonormalizando primeiramente Py(x) e Pi(x), para que possamos obter a reta que melhor aproxima 
f(x), obtemos: 


* P 1 v2 
Eai (x) = (P, P” = i 1/2 = z ; 
0,£0 e da] 
P, 1 v6 
Př (x) 15 = = Ti 
/2 1/2 
(P, P,)] En r2 da 2 
Assim os coeficientes ao e aı são dados por: 
1 
dg = (f, Pò) = VA Sado = ces 
12 5 
1 
a = (LP) = ip E S 
= 2 3 
Portanto: 
VD a 5V3 o 
flo) = Qua) = É Be) — DO Pro) 


v2 [42 5/6 [v6 
= 2 3 A 


Devemos agora, ortonormalizar P>(x), (para obtermos a parábola). Assim: 


P P, (x? — 1/3) 
Poa) = 1/2 — 1/2 
(Po, Po)] / E (x2 — 1/3)? dz $ 
VÃO > 
Mo (2 1/8). 
Então: 
1 SALTO 410 
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Portanto: 
Ho) = Quo) = Quo) + lisa) 
o [x2 [42 5v6 [6 
“5 a E ado 


410 | 310 , > 
35 | A (x 19). 


Observe que se agruparmos os termos semelhantes na última expressão obtemos exatamente (8.1), 
pois estaremos escrevendo a parábola em termos da base canônica de Ks(x). 


Exercícios 


8.4 - Aproximar, pelo método dos mínimos quadrados, a função f(x) = x? +4 x, no intervalo [0,1], 
a) por uma reta, 
b) por um polinômio do 2º grau, 


usando polinômios ortonormais. 


8.5 - Usando o método dos mínimos quadrados, aproximar a função f(x) = (x? —3 x+ 4)? 1 € 
[0,1], 


a) por uma reta; 
b) por um polinômio do 2º grau, 


usando polinômios ortogonais. 


8.2.2 Caso Discreto: 


Vejamos agora o caso em que a função é dada por n+1 pares de pontos (xo, yo), (21,Y1), ---, (En, Yn), 
onde y; = f(x;), :=0,1,...,n, com os n + 1 pontos xo, £1,...,n distintos. 


Procuramos determinar um polinômio (a coeficientes reais) 


Palr) = ao + a T+... +am 2”, (8.6) 


de grau no máximo m ,(m < n), e tal que: 


Q =|| f- Pal, 
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seja mínimo. Usando o produto escalar: 
(S9) = X. fa) atm: 
k=0 
obtemos: 
Q = | f— Pm |? = (f — Pm, f — Pm) 
= > [f (xx) — Pm (£)? = (yr — Pm (2x) 
k=0 k=0 
= (Yk — (ao + a1 Tk +... + am r). 
k=0 
Assim, dados os n + 1 pontos distintos £o, £1, ..., Zn € n+ 1 valores de uma função y = f(x) sobre 


os pontos xx, desejamos determinar um polinômio de grau no máximo m menor do que n tal que a soma 
dos quadrados dos desvios yk — Pm(£ķ) entre os valores de f(x) e Pm(x) calculados nos pontos £p, seja 


a menor possível. 


Na verdade, precisamos determinar, na classe de todos os polinômios de grau < m, aquele que mini- 


mize Q. 


O nosso problema resulta em última análise na determinação dos coeficientes ao, a1, ..., Am de Pn(x). 


Assim, coloquemos, por definição: 


Yo Pr (xo) 
yı Pm (xı) 

y = ? P = A 7 
Yn Pm (£n) 


onde y e p são vetores do IR". 


Usando (8.6), vemos que p pode ser escrito como: 


2 m 

1 zo To Ty 

1 zı xi tr 

P = ao ; + q i + a2 ; +... + am 
2 m 
1 Ën io Ly 
Denotando por: 
i 
1 TO 
1 zi 
ugo = , Ui = . , 1= 1, 2, ‘m, 
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podemos escrever: 
p = aouo + aqui +...+ amum - 
Vamos mostrar agora que se os n + 1 pontos são distintos, então os m + 1 vetores ug, U1, ..., Um 


são linearmente independentes. 


Para tanto, observe que p pode também ser escrito como: 


To To ao 
1 na cT ai 
BaT 1 Em T, a 
1 2 m a 
Ta elo w m 
Seja A a matriz dos coeficientes; isto é: 
1 zo 24 zo 
1 a ye rT 
Site eta 
1 Em T, go 
Te va ma am 


A matriz A possui n + 1 linhas por m + 1 colunas, com n > m. Seja A’, a submatriz quadrada 
constituída das m + 1 primeiras linhas e m + 1 primeiras colunas de 4. Assim: 


2 m 

1 £o To £O 

m 

A= 1 om a zI 
2 m 

E E Do 


A matriz A' é tal que det 4º = [[;,, (x; — zj). Desde que os pontos xo, £1, ..., £n são distintos 
segue que detA’ £ 0. (Este fato está demonstrado no Capítulo 10).Então existe uma submatriz de A, de 
ordem m + 1, que é não singular. Assim, os vetores ug, U1, -.., Um SãO linearmente independentes. 


Portanto uo, u1,..., Um geram em IR"*! um sub-espaço vetorial V de dimensão m +1 < n + 1 (pois 
m < n, por hipótese). 


Temos que: y € IR”+! e p € V C IR"+! e queremos que a distância de y a p seja mínima. Isto ocorrerá 
quando p for a projeção ortogonal de y sobre V. 


Os coeficientes ao, a1,..., Gm do polinômio procurado são então dados pelo sistema normal: 


(uo,uo) (u1, uo) (um, uo) ao (y, uo) 
(uo, u1) (u1, u1) (um, u1) a B (yu) 
(o, tim) (tm) (Um, Um) am (Y, um) 
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A menos que seja sugerido o produto escalar a ser utilizado, usa-se o produto escalar usual do IR?+1, 
isto é: 
n 
(x,y) Es 5 Ti Yi, 
i=1 
t 
onde zx = (£o, £1, ...., Zn) ey = (Yo, Yi, -.., Yn) ; 


Exemplo 8.3 Dada a função y = f(x), por meio da tabela: 


ajustá-la por um polinômio do 2° grau, usando o método dos mínimos quadrados. 


Solução: Neste caso queremos: f(x) = P (£) = ao + aı z +a x2. Assim, devemos construir 
p = ao Uo +Ha U1 + Q2 uso. 
Fazendo: 
0 1 —1 1 
—1 1 0 0 
y= 0 ; uo = 1 ; ui = 1 ; U2 = 1 , 
T 1 2 4 


(uo uo) (u1,uo) (u2,uo) ao (y, uo) 
(uo u1) (uu) (u2,u1) a | = (yu) 
(uo, u2) (u1, u2) (u2, u2) a2 (y, u2) 


Usando o produto escalar usual do IR4, segue que: 


(uouo) = 1+1+1+1 = 4, 

(uo,m) = —1+0+1+2 = 2 = (u,uo), 
(uo,u2) = 1+0+1+4 = 6 = (u2,u0), 
(m,m) = 1+0+1+4 = 6, 

(u1,u2) = —1+0+1+8 = 8 = (u2,u1), 
(uz,u2) = 1+0+1+16 = 18, 

(yu) = 0+-1404+7=6, 

(pu) = 0+0+04+14 = 14, 

(y,u2) = 0+0+0+28 = 28. 
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Obtemos então o sistema linear: 


4 2 6 ao 6 
26 8 a l=[ 14 |, 
6 8 18 ag 28 
RE RR DR RR 
cuja soluçao e: dg = 5 a = 5º a = x 


Portanto a parábola que melhor aproxima a função tabelada é: 


8 1 
P(a) = a a 2a. 


Exercícios 


8.6 - Determinar, pelo método dos mínimos quadrados, a reta mais próxima dos pontos (xi, yi) para a 
função y = f(x) tabelada: 


z |-2 -1 0 1 2 
y | 0 -1 0 7 


8.7 - Determinar a parábola mais próxima dos pontos (xi, yi) para a função y = f(x) tabelada: 


usando o método dos mínimos quadrados. 


8.8 - Usando o método dos mínimos quadrados, aproxime a função dada pela tabela: 


z | 0 1 2 3 4 5 
y | -1 0 3 8 15 24 
por um polinômio do tipo:P(x) = a+b x2, usando o produto escalar: 


n 
(z,y) = X` (6+1) z: yi. 
i=0 
8.2.3 Erro de Truncamento 
O erro de truncamento no método dos mínimos quadrados é dado por Q. 


Assim temos: 


a) caso contínuo: 


b 
E E A = f Ga-Pa de: 
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b) caso discreto: 


n 


Q=I| f — Pm I? = X (ye — Pa (20)? 


k=0 


Para ilustrar, calculemos o erro de truncamento no último exemplo. Assim: 


Q 


Observações: 


(yk — Po (£)? 


3 3 
yk —2 > uPalar) + > PÈ (zx) 
k=0 k=0 k=0 
492 1230 4 
50 D+ =5-08 
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a) O valor encontrado (Q = 0.8) corresponde à soma dos quadrados dos desvios entre os valores da 
função e do polinômio calculados nos pontos tabelados. Além disso, podemos afirmar que a parábola 
encontrada é a melhor entre as equações do 2º grau, ou seja, para qualquer outra parábola teremos 
para Q um valor maior do que o encontrado. 


b) Em muitos casos, os dados experimentais não se assemelham a polinômios. Se faz necessário então 
procurar funções (não polinomiais) que melhor aproximem os dados. Trataremos nas próximas duas 
seções de como aproximar uma função dada por funções que não sejam polinômios. 


8.3 Aproximação Trigonométrica 


Suponha que a função a ser aproximada tem caracteristícas de periodicidade. Neste caso, aproximar 
por polinômio não seria uma boa escolha, visto que estes não possuem a propriedade de serem periódicos. 
Devemos portanto tentar aproximar a função por uma outra que tenha propriedades semelhantes à função 


que estamos querendo aproximar. 


8.3.1 Caso Contínuo 


Consideremos uma função f(x) periódica e integrável em [0, 27]. 


Desejamos aproximar f(x), x € [0,27], por uma função do tipo: 


Ha) 


ao +a, cos £+ bı sen x+ a cos 2x + bo sen 2x 


“tam cos MT + bm sen mz = F(x). 


(8.7) 


de tal modo que a distância de f a F seja mínima. A aproximação da forma é chamada apro- 
ximação trigonométrica de ordem m, para f(x). 


Adotando o produto escalar: 


27 


(1,9) = Fa) g(x) dz , 


0 
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nosso objetivo é minimizar: 
27 
Q =|| f-F|?= f (Ha) - F(2)}? de 


Evidentemente, tal objetivo será alcançado quando F for a projeção ortogonal de f sobre o subespaço 
gerado por: 


{1,cos x, sen x,cos 2x, sen 2x,...,cos MT, sen max). (8.9) 
Assim, os coeficientes: a9,01,b1,...,4m,bm são determinados resolvendo-se o sistema normal: 
(1,1) (cos 1,1) is (sen ma,1) ao 
(1,cos x) (cos z,cos x) ... (sen mg,cos x) ar 
(1,sen mx) (cos z,sen mz) ... (sen mz, sen ma) bm 
(1,1) 
(f,cos x) 


= (8.10) 


(f, sen ma) 
A sequência é ortogonal em [0,27], isto é: 
27 
f sen px cos qxz dz = 0, 
0 
e temos: 


27 0 PÊGq, 
/ sen pr sen qx dr = 
0 


0 pq, 
27 
/ cospr cosgr dz = T p=q#0, 
0 
27 p=q=0. 
Portanto o sistema (8.10), se reduz a: 
27 ao (f, 1) 


T O a (f, cos x) 
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cuja solução é dada por: 


1 27 

àg = 97 A f(x) dz, 
1 27 

ak = = (x) cos ke de, k= 1,2,...,m , 
T Jo 
1 2m 

bk = — (x) sen kz de, k= 1,2,..., m. 
T Jo 


Observações: 


i) Se a função dada é uma função par, então, desde que sen x é uma função impar, temos que: 


2T 
(x) sena de = 0, 
0 
e portanto: 
m 
f(x) = a+) ak cos kz. 
k=1 


ii) Se a função dada é uma função impar, então, desde que cos x é uma função par, temos que: 
27 
(x) cos z dr = 0, 
0 


e portanto: 


fla) = 5 by sen ka. 
k=1 


iii) A aproximação de f(x) no intervalo [0,27] por (8.7), usando o produto escalar (8.8), pelo método 
dos mínimos quadrados é também conhecido como Análise Harmônica. Os termos: a; cos kz + 
bk sen kx podem ser expressos na forma: Ay sen(ka + Yk), onde 


ak 
Ák = (ak HOR) e tge = qo, 


e são chamados harmônicos de ordem k. O termo Ay é denominado amplitude e Yp ângulo de fase. 


Exemplo 8.4 - Obter aproximação trigonométrica de ordem 1, para: 


f(x) = |xl, -7<e<r. 


Solução: Prolongando a função dada, periodicamente, (período 27), obtemos: 


CAPÍTULO 8. APROXIMAÇÃO DE FUNÇÕES: MÉTODO DOS MÍNIMOS QUADRADOS 249 


Devemos determinar então F(x) tal que: 
f(x) = ao+a cos z+ bı senz = F(x). 


Observe que integrar de —7 a 7 é igual a integrar de O a 27 e que a função dada é uma função par, 
logo bı = 0 e portanto: 
f(£) = ao+a cos x = F(x). 


Assim: 
1 27 T 
ao z Jy (x) da TA x dz 
1 2m 2 T 
q = — x cos z dr = — x cos q dx 
T Jo T Jo 
2 a T 
= -|x sen z] — sen x dx 
T 0 
2 g 4 
= 0+ Ž cos z| = ——. 
T o T 


Portanto, obtemos que a aproximação trigonométrica de ordem 1 para a função dada é: 


4 
fæ) = T Í cosa. 
2 q 
Exercícios: 
8.9 - Mostre que o conjunto das funções: 
fl, cost, sent, cos 2t, sen 2t,..., sen mt}, 


é um sistema ortogonal em [—7, 1). 
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8.10 - Considere a função: 


Verificar que a aproximação trigonométrica de grau 2: 


y(t) = ao +aı cos t+b; sen t+az cos 2t + bz sen 2t 
4 


para y(t) é dada por: y(t) = q sen2t. 


Obs: Estenda y(t) a uma função impar de período 27. 


8.3.2 Caso Discreto 


Consideremos uma função f(x) conhecida nos N pontos distintos: 


Desejamos aproximar f(x), por uma função do tipo: 


f(x) = ao+a cos z+ bı sen x +az cos 2g + bz sen 2x 


(8.11) 
+ ...+azr cos Lz + bgr sen Le = S(x). 


com L < N, de tal modo que a distância de f a Sz seja mínima. 


Adotando o produto escalar: 


N 
(19) = Do fla) glz) . (8.12) 


k=1 


nosso objetivo é minimizar: 


N 


Q =| f- Srl = XO (fx) - Sula)? 


k=1 


Evidentemente, tal objetivo será alcançado quando S&S; for a projeção ortogonal de f sobre o subespaço 
gerado por: 
{1, cos x, sen x, cos 2x, sen 2x, ..., cos Lx, sen Ley}. (8.13) 


Assim, os coeficientes: ao, a1,b1,...,az,br são determinados resolvendo-se o sistema (8.10), onde o 
produto escalar é dado por (8.12). 


A sequência (8.13) é ortogonal em [0,27], isto é: 


N 


>, sen px, cos qr; = 0, (8.14) 
k=1 
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e temos: 

N 0 pq, 

> sen PXk Sen qk = 

k=1 A p=q%0. 
0 PÊq, 

N 

X cos pt COS q£k = N p=q%0, 

k=1 
N 


PI p=q=0. 


Observe que o sistema normal aqui é o mesmo do caso contínuo, o que muda é o produto escalar, pois 
nesse caso temos a função tabelada. Portanto o sistema normal se reduz a: 


N 
ao (f, 1) 
N O aq E (f,cos x) 
O a ja (f, Soni La) 


cuja solução é dada por: 


1 N 
a = md f(x), 


N 
2 
aj = md Fe) cos: Grs k = 152504. dos 
k=1 
2X 
bj = T Do flu) sen jzk , k=1,2,..., L. 


Exemplo 8.5 - Obter aproximação trigonométrica de ordem 1, para a função dada pela tabela : 
T T 37 5T 37 TT 

E 2 4 ST 4 2 4 
f(x) | 126 159 191 178 183 179 176 149 


usando o método dos mínimos quadrados. 


Solução: Note que os pontos tabelados são: xp = RL k=1,2,...,8. 
Devemos determinar então Sr(a) tal que: 


fla) = ao+a cos z +b senz = S(x). 
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Assim: 


do = flar) = 167.625 


o | = 


oo | N 


8 
z 
k=1 
8 
q = 55, f(x) cos x = —19.978 
k=1 
8 
zo 


b = f(x) sen xp = —12.425 


oo | N 


Portanto, obtemos que a aproximação trigonométrica de ordem 1 para a função dada é: 


f(x) = 167.625 — 19.978 cos x — 12.425 sen x. 


Exercício 
8.11 - Considere a função f(x), dada por: 


k 1 2 3 4 5 6 
f(x) 11.8 4.3 13.8 3.9 —18.1 —22.9 


7 8 9 10 11 12 
—27.2 —23.8 8.2 31.7 34.2 38.4 


2kr 


onde £k = TT Obtenha aproximação trigonométrica, de ordem 2, usando o método dos mínimos qua- 
drados. 


Observe que se utilizarmos o produto escalar dado por (8.12) com £k = o k=1,2,...,N, estare- 
mos fazendo uma análise harmônica aproximada. 


8.4 Outros Tipos de Aproximação 


O objetivo dos métodos dos mínimos quadrados é aproximar a função dada por uma família linear 
nos parâmetros, isto é, definidas por expressões da forma: 


ao golxz) + aı ga(x) +... + am Imlx). 


Muitos casos podem ser reduzidos a essa forma por uma transformação prévia do problema, isto é, 
nosso objetivo agora consiste na linearização do problema, através de transformações convenientes, de 
modo que o método dos mínimos quadrados possa ser aplicado. Daremos a seguir alguns exemplos que 
ilustram o problema a ser resolvido. 


1º caso: Aproximar f(x) por uma função do tipo exponencial, isto é, 


fo ~ ab”, 
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pode ser reduzido por uma transformação logarítmica ao de aproximar: 


in f(x) = Ina + vinb. 


Fazendo: 


reduzimos o problema original ao de aproximar F(x) por ao go(z) + a gi(a). 


Assim aq e a; serão obtidos resolvendo-se o sistema linear: 


(go(x), go(£))  (gi(x), go(x)) ao (F(x), go(x)) 
= . (8.15) 
(go(x), g1(x)) (gi(x), g1(2)) ar (F(x), gi(x)) 


Obtidos os valores de ao e a1, a aplicação da função exponencial em ao =ln a e ay = ln b retorna 
os valores originais requeridos, isto é: a = e0 e b = eM, 


Observe que em todos os casos desta seção, o método dos mínimos quadrados será então aplicado 
ao problema linearizado, seguido de um retorno aos parâmetros originais. Portanto os parâmetros assim 
obtidos não serão, em geral, ótimos no sentido do método dos mínimos quadrados, pois este não terá sido 
aplicado ao problema original. 


2° caso: Aproximar f(x) por uma função do tipo geométrica, isto é, 


fa) = ax, 


pode ser reduzido por uma transformação logarítmica ao de aproximar 


in f(x) = Ina + bina. 


Fazendo: 
F(z) = In f(x); 


golz) = 1; g(x) = Ing, 


reduzimos o problema original ao de aproximar F(x) por ao go(z) + a gi(x). Assim ag e a; serão ob- 
tidos resolvendo-se o sistema linear (8.15). Nesse caso a volta aos parâmetros originais será feita usando 
exponencial para determinação de a, e b será simplesmente o valor de a. 
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3º caso: Aproximar f(x) por uma função do tipo hiperbólica, isto é, 


1 
f(x) = abbr 
pode ser reduzido ao problema de aproximar: 
5) = a+ba. 
Fazendo: 
Fle) = Fy 
ao = a; @ı = b; 
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reduzimos o problema original ao de aproximar F(x) por ao go(x) + a gı(x). Assim ao e a serão 
obtidos resolvendo-se o sistema linear (8.15). Nesse caso os parâmetros originais serão simplesmente o 


valor de ao e de a1. 


Já deu para notar como deve ser resolvido o problema. Assim nos próximos casos apenas faremos a 


parte da transformação a ser realizada. 
4º caso: Aproximar f(x) por uma função do tipo Va + b x, isto é: 


f(x) = va+ba, 


pode ser reduzido ao problema de aproximar: 


fla) = a + bg. 


Fazemos então: 


go(x) = 1; gn(x) = 2 
5º caso: Aproximar f(x) por uma função do tipo x In (a + b zx), isto é, 


f(x) = vin (a+b zr), 


pode ser reduzido ao problema de aproximar: 


Ha) 


eToca+ba. 
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Fazemos então: 


Daremos a seguir alguns exemplos. 


Exemplo 8.6 Aproximar a função tabelada: 


por uma função racional, isto é: 
a+r? 


fo) = SE 
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Solução: Em primeiro lugar devemos rearranjar a equação de tal forma que o lado direito seja com- 


binação linear de funções conhecidas. Assim: 


Fazendo: 


go(x) = 1; gı = z(y(x)-— a), 


obtemos que F(x) = ao go(z) + a gı(x). Assim, devemos resolver o sistema (8.15), onde: 


1 1 0 

1 1 0 
F(x) 1.7 » Jo = 1 » gı —0.6 
2.5 1 —1.5 


Usando o produto escalar usual, obtemos: 
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4 -21 ao 6.2 
—2.1 2.61 a = —4.77 i 
cuja solução é: ao = 1.0224 e a = —1.005. 
Agora, desde que: 
1 e 1 
a = -3 = b = “a 
=b = 0.9950, 
ag = 5 >a = ao Xb 
> a = 1.0173, 
obtemos que: 
F(x) ~ 1.0224 — 1.005[x(y(x) — x)|], 
2 
ylz) s LOL tr ; 
Note que a função minimizada foi: 
3 
Q = > [yi — (1.0224 — 1.005 x;(yi — mi)”, 
i=0 
isto é, foi minimizado o quadrado da diferença entre a função F(x) = y(x) e a função ao + [x(y(x)—«)). 


Exemplo 8.7 - A intensidade de uma fonte radioativa é dada por: 


Através de observações, tem-se: 


t | 0.2 0.3 0.4 0.5 0.6 0.7 0.8 
I | 3.16 2.38 1.75 1.34 1.00 0.74 0.56 


Determinar Ío e a. 
Solução: Novamente devemos rearranjar a equação. Assim: 
I ~ Ioe 
> lInlolnlo-at. 


Fazendo, então: 
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obtemos que F(t) = ao go(t) + a gi(t). Assim, devemos resolver o sistema (8.15), onde: 


1.15 1 0.2 

0.87 1 0.3 

0.56 1 0.4 

F(t) = 0.30 | ; gt) = | 1 |;a() = | 05 
0.00 1 0.6 

—0.30 1 0.7 

—0.58 1 0.8 


Usando o produto escalar usual, obtemos: 


(as 20) (a) = (ox): 


cuja solução é: ao = 1.7304 e aq = —2.8893. 
Agora, desde que: 
q = —Qa => Q = 2.8893, 
ag = in Io > lo = elo 


> Io = 5.6429 , 


obtemos: 
F(t) = 1.7304 — 2.8893 t, 


I ~ 5.6429 e72-8893 t, 


A função minimizada foi: 


6 


Q = 53 {F(t:) — (1.73 — 2.89t:)}" . 


i=0 
Observe que para os casos onde a função f é determinada empiricamente por pontos observados, o 
problema que surge é: qual família ajusta melhor os dados? 
A seleção de funções pode ser feito percorrendo-se as seguintes etapas: 


i) Selecionar a priori um número pequeno de famílias de funções. ( A escolha das famílias deve ser tal 
que os membros sejam de fácil avaliação para argumentos dados). 


ii) Utilizar todas as informações disponíveis sobre f para eliminar as famílias que obviamente não são 
adequadas. 


iii) Aplicar às famílias que restarem o chamado teste de alinhamento. (Este teste está descrito a seguir). 


iv) Determinar os parâmetros para as famílias que passaram pelo teste de alinhamento e escolher o 
melhor resultado por comparação. 
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Teste de Alinhamento: 
O teste de alinhamento consiste em: 


i) Transformar a equação da família y = f(x) em, por exemplo, outras duas famílias: Fi(x) = 
ao golx) + a gx) onde go(x) = 1 e ay e aq não dependem de Fi(x) e ga(x) e Fo(x) = 
ah go(x) + aí gi(x) onde g(x) = 1 e ag a) não dependem de Fo(x) e gi(a). 


ii) Fazer os gráficos: (I) gi(x) contra Fi(x) e (II) gi(x) contra Fo(a). 
iii) Escolher a família F} (x) se o gráfico (I) estiver mais linear que o gráfico (II), e Fo(x) se o gráfico 


(II) for mais linear que (I). 


Observe que devido aos erros de observação que afetam x, e f(x), não excluiremos a família se os 
pontos no gráfico se distribuirem aleatoriamente em torno de uma reta média. 


Exemplo 8.8 - Considere a função dada pela tabela: 


Qual das funções: 


ajustaria melhor os dados da tabela? 


Solução: Em primeiro lugar devemos linearizar as funções a) e b). Assim de y(t) = a obtemos: 


1 
D —- ca+bt. 
O st) 
Fazendo: i 
FA = ~; 
GES 
ao = a; @ = b; 
go(t) = 1; g(t) = t, 


obtemos que Fi(t) = ao go(t) + a gı(t). Assim devemos fazer o gráfico de t contra F: 
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Ned Le 


Para y(t) = a b! obtemos: 
(II) inyl)=ina+t+tind. 


Fazendo: 


obtemos que Fo(t) = ao go(t) + a gi(t). Assim devemos fazer o gráfico de t contra In y(t) : 


Iny 


Vemos que o gráfico de t contra 1C é mais linear que o gráfico de t contra ln y(t). Assim, devemos 


escolher y = —L— para aproximar a função dada. 
Y= aFbt 
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Note que o problema só estará resolvido se pudermos linearizar a função dada. Entretanto, existem 
casos onde a função não pode ser linearizada diretamente, como mostra o exemplo a seguir. 


Exemplo 8.9 - Aproximar f(x) dada pela tabela: 


£ [O 2 4 6 8 10 00 
f(x) | 84.8 75.0 67.2 61.9 57.6 53.4 20.0 


por função do tipo: +c. 


ses: 
a+b 
Solução: Não existe uma transformação que torne o lado direito ( da aproximação) combinação linear 
de funções conhecidas. Podemos entretanto, tentar resolver o problema analisando a função f. Neste 


caso, sobre a função f, conhecemos os valores dados na tabela e f tem como limite para x — oo o valor 
20. Como 


1 1 
a+ f(x) — 20 
através de a+b x. A vantagem prática é que temos agora uma família linear nos parâmetros e podemos 
determiná-los resolvendo o sistema (8.15). Assim, fazendo: 


Substituímos então o problema de aproximar f(x) através de 


mars pelo de aproximar 


0.0154 
0.0182 

1 0.0212 

~ f(æ)—20 | 0.0239 
0.0266 

0.0299 


SO 0 o ENO 


1 
1 
1 
glz) = | 4 [5 a) = 
1 
1 


a 


e usando o produto escalar usual, obtemos: 
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6 30 ao \ (01352 
30 220 ay J) T A 0.7748 j ’ 


cuja solução é: ao = 0.0155 = a e a = 0.0014 = b. Portanto: 


1 
fe) = Soss tooo 1 


Novamente minimizamos o quadrado da diferença entre a função F(x) e a reta ao + a z. 


Exercícios 


8.12 - Deseja-se aproximar uma função f definida em um intervalo [a,b| por uma função 


3 
EaD e 
Ro (5a) | 


usando o método dos minímos quadrados. 


a) Qual é a função a ser minimizada? 


b) Qual é o sistema linear a ser resolvido? 


8.13 - Sejam f(x) e g(x), funções reais distintas não identicamente nulas. Suponha que, usando o 
método dos minímos quadrados, aproximamos f(x) em [a,b] por: 


F(x) = ao flar) +a g(x). 
a) Quais os valores que devem ser atibuídos para ay e a? 


b) Qual será o erro? 


8.14 - É possível aproximar diretamente uma função f(x) tabelada, por uma função do tipo: 


to) = (ra) 


usando o método dos minímos quadrados? Se não for possível, qual é a transformação que deve ser 
feita? 
8.15 - Considere a função dada por: 


|15 20 25 30 
f(x) J21 32 44 58 


a) Ajuste os pontos acima por uma função do tipo Va-+bx, usando o método dos mínimos 
quadrados. 


b) Qual função foi minimizada? 
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8.16 - Ajustar os valores da tabela: 


s |? 5 8 11 14 17 + 3l 41 44 
fx) [948 897 813 749 68.7 640 493 440 391 316 


ba 1 T 
a+br ' a+br ` 


Use o teste de alinhamento para decidir qual das funções melhor resolve o problema. 


O método dos mínimos quadrados se aplica também à determinação da melhor solução de sistemas 
lineares incompatíveis. Assim, passamos a descrever 


8.5 Sistemas Lineares Incompatíveis 


Ocorre frequentemente na prática problema da natureza seguinte: temos que determinar uma função 


y que depende linearmente de certas variáveis 71,%2,...,Ym, istO é, 
Y = ax + cars +...+ Mm; 
onde os c;, i = 1,2,...,m, são coeficientes desconhecidos fixados. 


Na maioria dos casos os c; são determinados experimentalmente, perfazendo-se um certo número 


de medidas das grandezas £1, %2,...,&m e y. Se designarmos por x;1,%;2,...,Xjm,Yj OS resultados 
correspondentes à j-ésima medida, tentamos determinar c4,c2,...,Cm à partir do sistema de equações: 
Z111 T T12C2 T ... T Timm = WU 
T211 T T2202 T ... T Tombm = Y2 (8 16) 
nici + Tn2C2 +... + nmm = Yn 


Em geral, o número n de medidas é maior que o número m de incógnitas e devido aos erros expe- 
rimentais o sistema resulta ser incompatível e sua solução só pode ser obtida aproximadamente. 
O problema que precisa, então, ser resolvido é o da determinação dos c1, C2, ...,Cm de modo que o lado 
esquerdo das equações forneça resultados tão “próximos” quanto possível dos correspondentes 
resultados do lado direito. Resta-nos apenas, para a solução do problema, precisarmos o conceito de 
proximidade. Como medida dessa proximidade adotaremos o quadrado da distância euclidiana entre y e 
z do IR”, onde: 


yı £111 T T122 +... T LTmêm 

y = Ya z% T2101 T T22C2 +... T Lmbm 
= : 3 = 

Yn nici + Lnzco +... + LnmEm 


Assim: a 
Q =I|z-y|ê= X (zac + toc +... + Timm — Yi). 
i=1 
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Esse problema, como sabemos, pode ser facilmente resolvido, determinando-se a projeção de y € IR” 
sobre o subespaço gerado pelos vetores: 


£11 T12 Tim 
T21 T22 Tam 

gı = kl 92 no . a » Im = ? 
Tni Tn Tnm 


uma vez que o vetor z que procuramos, tal que || z — y ||? seja mínima, pode ser expresso como: 
2 = cg + C292 +... + Cmm .- 


Isto é, z € ao sub-espaço gerado por g91,92,...,Jm- Supondo os gi, i = 1,...,m, linearmente 
independentes, a solução do problema é dada por: 


(91,91) (92,91) --- (Im) a (1,91) 
Cardo) (omo) o (mto) jeep, (8.17) 
(91,9m) (92»9m) +. (Jm, Im) Ea (ty, Gm) 


onde: 


n n 
(gi; 9j) = 5 Tki kj ; (Y,9j) = Xok Tkj - 
k=1 k=1 


Exemplo 8.10 - Determinar, pelo método dos mínimos quadrados, o valor de c na equação: 


yY =c , 
sabendo-se que c satisfaz às equações: 
20 = 3 
3c = 4 
4c = 5 
Solução: Temos que: 
2 3 
gı = 3 e y= 4 
4 5 


onde: 
(91,91) = 4+9+16 = 29 , 


(y, 91) = 6+12+20 = 38, 
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Logo: - 
29c = 38 > c= 5 ` 
Portanto a reta procurada é: 
y = 3 T: 


Note que o caso acima é um caso particular do problema de se determinar c tal que: 


y = cr. 


O sistema (8.16) reduz-se a um sistema de n equações a uma incógnita: 


Tı č = Yı 
tac = Y2 
Tn C = Yn 


Como é fácil de se verificar, c deve satisfazer: 


(91:9) Des Tk Yk 


(91,91) ER Eh 


Nesse caso, c é geometricamente interpretado como o coeficiente angular da reta através da origem 
Fi P ? 
y = cx, que está tão próximo quanto possível dos pontos (£1, y1), (£2, Y2), <- -, (Ln, Yn). 


Exercícios: 


8.17 - Determinar a melhor solução para o sistema: 


Tı = to = —1 
231 T lo = —2 
=b — 349 = 1 
2x1 —+ 319 = —2 
321 ga: 2x9 = —3 


8.18 - Resolver, pelo método dos mínimos quadrados, o sistema: 


321 Ir Ly — lg = 2 

Lj T 2x9 “to lg = 3 
211 == X2 T 303 = — 
=X Ei T2 = T3 = 0 


—2rı = 3x9 = 2x3 = 2 
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8.6 Exercícios Complementares 


8.19 - De uma tabela são extraídos os valores: 


Usando o método dos mínimos quadrados ajuste os dados acima por polinômio de grau adequado. 
Sugestão: use gráfico. 
8.20 - Considere a tabela: 
q | —2 -I 1 2 
y | 1 —3 1 9 


a) Pelo método dos mínimos quadrados, ajuste à tabela as funções: 
gı(x) = ax? + be; g(x) = cz’ +d . 
b) Qual das funções fornece o melhor ajuste segundo o critério dos mínimos quadrados? Jus- 
tifique. 
8.21 - Achar aproximação mínimos quadrados da forma: 
glx) = ae” + be”, 
correspondente aos dados: 


zı | 0 05 10 15 2.0 2.5 
yi | 502 5.21 649 9.54 1602 2453 


8.22 - Um dispositivo tem uma certa característica y que é função de uma variável x. Através de várias 
experiências foi obtido o gráfico: 
A 

y 

E E T 


Kaa e a 


2.8 | 2222 = 


Deseja-se conhecer o valor de y para x = 0.5. Da teoria sabe-se que a função que descreve y tem a 
forma aproximada de uma curva do tipo a 22 +b x. Obtenha valores aproximados para a e b, usando 
todas as observações, e então estime o valor para y quando x = 0.5 
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8.23 - Usando método dos mínimos quadrados aproxime a função f(x) = 3 zê — x? no intervalo [-1,1], 
por uma parábola, usando os polinômios de Legendre. 


Obs: Os polinômios de Legendre 
a 1 d” 
o man! de 


Lula) (12 1)"; Lo(x)=1, 


são ortogonais segundo o produto escalar: 


e além disso satisfazem: 


1 5 2 
Ligne És 
T O ET 


8.24 - Encontre a melhor aproximação para f(x) = sen 3x no intervalo [0,27], da forma: 
P(x) = ao +a cos x+ bı sen z. 

8.25 - Determinar aproximação trigonométrica de ordem 2, em [-7,7], para y(t) = |sent]. 

8.26 - Obter aproximação trigonométrica, de ordem 1, para a função : 

| T 27 47 57 27 


x T 


3 EE 3 3 
Hx) [07 0.75 -6 -0.75 0.75 6 


8.27 - Deseja-se aproximar uma função f > 0 tabelada por uma função do tipo: 


x2 


In (a xt +b r? +c) 


7 


usando o método dos minímos quadrados. 


a) Podemos aproximar f diretamente pela função acima? Caso não seja possível, quais são as 


transformações necessárias? 
b) Qual função será minimizada? 
c) Qual é o sistema linear a ser resolvido? 


8.28 - Usando o método dos mínimos quadrados encontre a e b tais que y = ax? ajusta os dados: 


x | 01 05 10 20 30 
y | 0.005 05 4 30 110 


8.29 - Considere a tabela: 


t | 3.8 7.0 9.5 11.3 17.5 315 45.5 64.0 950 
y | 10.0 12.5 13.5 14.0 15.0 16.0 165 17.0 17.5 


Por qual das funções : 
b) y= ab 


você ajustaria esta tabela? 
Sugestão: Faça o teste de alinhamento. 


CAPÍTULO 8. APROXIMAÇÃO DE FUNÇÕES: METODO DOS MÍNIMOS QUADRADOS 267 


8.30 - Qual das funções: 


1 
I) y=az +b; II y= 
) y=ar" +b; D 
ajusta melhor os valores da tabela: 
z | 0 0.5 10 15 20 25 30 
y | 2 1.5 0.5 15 45 90 170 


Usando o método dos mínimos quadrados ajuste os valores da tabela pela função escolhida. 


8.31 - Considere a tabela: 


x |10 15 20 25 30 
y LI 21 32 44 58 


Ajuste os pontos acima por uma função do tipo xln(axz +b), usando o método dos mínimos quadrados 


8.32 - Físicos querem aproximar os seguintes dados: 


2: | o1 05 10 20 
Ha) |013 0.57 146 505 


usando a função ae?” + c. Eles acreditam que b œ 1. 
i) Calcule os valores de a e c pelo método dos mínimos quadrados, assumindo que b = 1. 
ii) Use os valores de a e c obtidos em i) para estimar o valor de b. 


Observe que neste exercício, devemos, depois de encontrado o valor de b, (item ii)), recalcular o valor 
dea e cea seguir b, e assim por diante. 


8.33 - Usando o método dos mínimos quadrados achar a solução aproximada do sistema incompatível: 


a— 3b = 0.9 
2a — 5b = 1.9 
—a + 2b = —0.9 
3a — b = 3.0 
a+ 2b= 1.1 


8.34 - Determine pelo método dos mínimos quadrados a melhor solução para sistema linear incom- 
patível: 


2N+3M =8 
N+M =6 

3N+M=5 
N +3M =12 


onde N e M são restritos a valores inteiros. 
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8.35 - A tabela a seguir foi obtida da observação de determinado fenômeno que sabe-se é regido pela 
equação: 


E-ar+by. 
Sabendo que: 
x 2 1 1 —1 2 
y 3 —l 1 2 —1 
E 1 2 —1 1 3 


i) Determine pelo método dos mínimos quadrados a e b. 


ii) Qual o erro cometido? 


8.7 Problemas Aplicados e Projetos 


8.1 - A tabela a seguir lista o número de acidentes em veículos motorizados no Brasil em alguns anos 


entre 1980 e 1998. 


ano n° de acidentes acidentes por 
(em milhares) 10000 veículos 
1980 8.300 1.688 
1985 9.900 1.577 
1990 10.400 1.897 
1995 13.200 1.439 
1994 13.600 1.418 
1996 13.700 1.385 
1998 14.600 1.415 


a) Calcule a regressão linear do número de acidentes no tempo. Use-a para prever o número de 
acidentes no ano 2000. (Isto é chamada uma análise de série temporal, visto que é uma regressão 
no tempo e é usada para prognosticar o futuro). 


b) Calcule uma regressão quadrática do número de acidentes por 10000 veículos. Use esta para 
prognosticar o número de acidentes por 10000 veículos no ano 2000. 


c) Compare os resultados da parte a) e b). Em qual delas você está mais propenso a acreditar? 


Observe que em qualquer trabalho de série temporal envolvendo datas contemporâneas é uma boa idéia 
eliminar os dados iniciais antes de formar as somas; isto reduzirá os problemas de arredondamento. 
Assim, em vez de usar para x os valores 1980, 1985, etc, usamos 0, 5, etc. 


8.2 - À tabela a seguir lista o total de água (A) consumida nos Estados Unidos em bilhões de galões 
por dia: 
ano | 1950 1960 1970 1980 1990 
(A) | 136.43 202.70 322.90 411.20 494.10 
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a) Encontre uma regressão exponencial de consumo de água no tempo. 


b) Use os resultados do item a) para prever o consumo de água nos anos de 1995 e 2000. 


8.3 - O número de números primos menores que x é denotado por II(x) e vale a tabela: 


e | 100 1000 10000 100000 
(x) | 25 168 1229 9592 


a) Determinar pelo método dos mínimos quadrados , para os dados acima, expressão do tipo: 


I(x)=a+b 


logioz ` 
b) Estimar o número de números primos de 6 dígitos usando o item a). 


8.4 - Mr. K. P. Lear (1609, Way of Astronomy) teve a idéia de que a Terra se move ao redor do Sol 
em órbita elíptica, com o Sol em um dos focos. Depois de muitas observações e cálculos, ele obteve a 
tabela a seguir, onde r é a distância da Terra ao Sol, (em milhões de Km) e x é o ângulo (em graus) 
entre a linha Terra-Sol e o eizo principal da elipse. 


x | 0 45 90 135 180 
f | 147 148 150 151 152 


Mr. Lear sabe que uma elipse pode ser escrita pela fórmula: 


= P 
r= ————. 
l+ecos x 


Com os valores da tabela ele pode agora estimar os valores de p e e. Ajude Mr. Lear a estimar os 
valores de p e e, (depois de um re-arranjo da fórmula acima). 


8.5 -Placas de orifício com bordas em canto (ou faca) são muito utilizadas na medição da vazão de 
fluidos através de tubulações . A figura a seguir mostra uma placa de orifício, que tem os seguintes 
parâmetros geométricos representativos: 


e A = área da seção reta do orifício 
e A; = área da seção reta da tubulação 


e A = CA (seção reta no ponto de maior contração após o orifício) 
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O coeficiente C é função da razão A/A1, e valores experimentais desse coeficiente estão listados na 
tabela a seguir: 


A/A1 | 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 
C | 0.62 0.63 0.64 0.66 0.68 0.71 0.76 0.81 0.89 1.00 


a) Fazendo x = A/A, ajuste a função C(x) pela função: ao + aix + azz? aos pontos da tabela, 
usando o método dos mínimos quadrados. 


b) Faça um gráfico dos valores fornecidos pelo polinômio. Acrescente a esse gráfico os valores 
dos pontos da tabela. Comparando visualmente a curva dos valores fornecidos pelo polinômio, e os 
valores da tabela, você pode concluir que a aproximação obtida é boa? 


8.6 - A resistência à compressão do concreto, o, decresce com o aumento da razão água/cimento, E 


(em galões de água por saco de cimento). A resistência à compressão de três amostras de cilindros para 
várias razões g estão mostradas no gráfico a seguir: 
o 


8000 
7000 


6000 


5000 e 


4000 o 


3000 o 


2000 


A 
[oo 
O 
“q 
o0 
do) 
= 
o 

ale Y 


e, cujos valores estão na tabela: 


| 45 50 55 60 65 70 75 80 85 90 
| 7000 6125 5237 4665 4123 3810 3107 3070 2580 2287 


w 
c 
o 


a) Usando o método dos mínimos quadrados, ajuste o, aos dados, utilizando uma função do tipo: 
kı eTa, 


b) Compare os valores da curva obtida no itema) com os do gráfico, para verificar (por inspeção), 
se a curva obtida para o é uma boa aproximação. 


8.7 - Um fazendeiro, verificando a necessidade de construir um novo estábulo, escolheu um local 
próximo a uma nascente, de forma que, perto do estábulo, pudesse também ter um reservatório de água. 
Junto à nascente ele construiu uma barragem e instalou uma bomba, para que a água pudesse chegar ao 
reservatório. 

Verificou-se que: 


i) A vazão da fonte de alimentação , Q, era aproximadamente de 30 litros por minuto. (Quan- 
tidade de água que aflui à bomba). 


ii) A altura da queda, h, era de 6 metros. ( Altura entre a bomba e o nível da água da fonte de 
alimentação). 
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iii) O reservatório se encontrava a uma altura de recalque, H, de 46 metros. (Altura entre a 
bomba e o nível da água no reservatório). 


nivel 


da água Bt | 


reservatório 


Esses H 


nivel 
da água 


Munidos destes dados, o fazendeiro gostaria de saber quantas vacas leiteiras poderiam ocupar o estábulo, 
sabendo que o consumo diário de cada uma, incluindo o asseio do estábulo, é de 120 litros. 


Observação: 


Para resolver o problema deve-se calcular a vazão de recalque, q, que é a quantidade de litros por 
minuto que entram no reservatório. Para isso tem-se que aplicar a fórmula: 


onde R é o rendimento da bomba. 


Concliu-se portanto, que para determinar a vazão de recalque é necessário conhecer o rendimento da 


bomba. A tabela a seguir relaciona a razão entre as alturas u e o rendimento da bomba instalada. 


i | 6.0 6.5 7.0 7.5 8.0 8.5 9.0 
R | 06728 0.6476 0.6214 0.5940 0563 05350 05020 


h 


Consultando a tabela verificou-se que para calcular o R associado a um valor de H deveria ser feita 
uma regressão linear. 


8.8 Após serem efetuadas medições num gerador de corrente contínua, foram obtidos os seguintes 
valores indicados por um voltímetro e um amperímetro. 


I(carga(A)) [1.58 215 48 49 312 301 
V) | 210 180 150 120 60 30 


Faça um gráfico dos dados. 
a) Ajuste os dados por polinômio de grau adequado. 


a) Estime o valor a ser obtido no voltéímetro quando o amperímetro estiver marcando 3.054. 
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8.9 - Um tubo fino e comprido está imerso na água. Na base do tubo há um reator elétrico, que descreve 
um movimento sobe-e-desce oscilatório. Em qualquer instante, a coordenada y da base do tubo é dada pela 
fórmula: y = Asen (wt), onde À é a amplitude do movimento e w é a frequência de oscilação. Medidores 
de deformação colocados na base do tubo medem a deformação do mesmo, em função da amplitude de 
oscilação À. Os valores da deformação e medida em relação as amplitudes À encontram-se na tabela: 


À | 0.010 0.020 0.0025 0.038 0.050 0.070 
€ | 45x 1079 50 1078 69x107ë 87x107 101x107ë 112x 107° 


Colocando os dados da tabela, num gráfico: 


parece apropriado aproximar a função por uma parábola. Assim, usando o método dos mínimos quadrados: 
a) ajuste a função e por função do tipo: ao + aà + a2Aĉ?, 


b) Faça um gráfico dos valores de e(A) contra À, obtidos através da parábola, e marque no mesmo 
gráfico dos pontos da tabela. Qualitativamente falando, o polinômio é uma boa aproximação? 


8.10 - (Ajuste na curva tração /deformação de um tipo de aço). Feito um ensaio de tração em uma 
barra de um tipo de aço, em uma máquina universal de Amsler, foram obtidos os valores constantes da 
tabela a seguir. Deseja-se obter representações aproximadas para d = f(t). 


t(ton/m?) |08 18 28 38 48 58 68 78 88 98 
d 0.15 0.52 0.76 1.12 147 1.71 208 2.56 3.19 4.35 


10.0 10.2 10.4 10.6 10.8 11.0 11.2 114 11.6 11.8 
4.55 5.64 6.76 8.17 10.1 12.7 16.2 20.3 30.0 60.0 


Faça um gráfico dos dados. Observando o gráfico você verá que deve fazer: 
a) uma regressão linear para os 10 primeiros pontos (0.8 < t < 9.8). 
b) uma regressão quadrática para os Y pontos seguintes (10.0 < t < 11.2). 


c) uma regressão linear para os 3 últimos pontos (11.4 < t < 11.8). 
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8.11 - 4 tabela a seguir lista o Produto Nacional Bruto (PNB) em dólares constantes e correntes. Os 
dólares constantes representam o PNB baseado no valor do dólar em 1987. Os dólares correntes são 
simplesmente o valor sem nenhum ajuste de inflação. 


PNB PNB 
ano (dólar corrente) (dólar constante) 
(em milhões) (em milhões) 
1980 248.8 355.8 
1985 398.0 438.0 
1989 508.7 487.7 
1992 684.9 617.8 
1994 749.9 658.1 
1995 793.5 674.6 
1997 865.7 707.6 


Estudos mostram que a melhor forma de trabalhar os dados é aproximá-los por uma função do tipo: 
b . 
ax”. Assim: 


a) Utilize a função a x? para cada um dos PNB's no tempo. 
b) Use os resultados da parte a) para prever os PNB's no ano 2000. 
c) Que lhe dizem os resultados da parte b) sobre a taxa de inflação no ano 2000? 


8.12 - Em um estudo, determinou-se que a vazão de água em uma tubulação está relacionada com o 
diâmetro e com a inclinação desssa tubulação (em relação à horizontal). Os dados experimentais estão 
na tabela a seguir: 


Experimento Diâmetro Inclinação Vazão (m/s) 

1 1 0.001 1.4 

2 2 0.001 8.3 

3 3 0.001 24.2 
4 1 0.01 4.7 
5 2 0.01 28.9 
6 3 0.01 84.0 
7 1 0.05 11.1 

8 2 0.05 69.0 
9 3 0.05 200.0 


O estudo também sugere que a equação que rege a vazão da água tem a seguinte forma: 
Q = ade se, 


onde Q é a vazão ( em m/s), S é a inclinação da tubulação, D é o diâmetro da tubulação (em m) e 
ao,@ı e as são constantes a determinar. 


*1.0cm a) Usando a equação acima e o método dos mínimos quadrados determine ag,a e az. 
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*1.0cm b) Use o resultado do item a) para estimar a vazão em m/s para uma tubulação com um 
diâmetro de 2.5m e uma inclinação de 0.0025. 


8.13 - Os dados das tabelas a seguir mostram a quantidade de alcatrão e nicotina (em miligramas) 
para várias marcas de cigarro com e sem filtro : 


COM FILTRO 
ALCAT. 8.3 12.3 18.6 22.9 23.1 24.0 273 30.0 35.9 41.5 
NICOT. 0.52 0.46 1.10 1.32 1.26 1.44 1.42 1.96 2.23 2.20 


SEM FILTRO 
ALCAT. | 32.5 33.0 34.2 34.8 36.5 372 384 41.1 41.6 434 
NICOT. 1.69 1.76 1.48 1.88 1.73 2.12 2.395 2.46 1.97 2.65 


i) Calcule as regressões lineares do tipo ax +b para a relação entre nicotina (y) e alcatrão (x) 
em ambos os casos (com e sem filtro). 


ii) Discuta a hipótese de a (coeficiente angular) ser o mesmo nos dois casos. 


iii) Para uma certa quantidade de alcatrão, os cigarros com filtro contém menos nicotina que 
os sem filtro? 


8.14 -Em uma floresta densa, dois formigueiros inimigos, separados por um rio, travam uma longa 
batalha. Um dos formigueiros, visando acabar gradativamente com a espécie inimiga, dá uma cartada 
fatal, sequestrando a rainha. Para não ver seu formigueiro destruído, algumas formigas guerreiras se 
unem com as formigas engenheiras numa arriscada operação de resgate à rainha. Mas como resgatá-la? 


As formigas guias arquitetaram um plano de resgate que consistia em arremessar algumas formigas 
guerreiras, algumas formigas engenheiras, algumas guias e algumas operárias sobre o formigueiro inimigo. 
Chegando lá, elas dividiriam-se em dois grupos. Um grupo composto pelas formigas guerreiras e formigas 
guias, incumbiria-se de entrar no formigueiro inimigo em busca da rainha. O outro grupo, composto 
pelas formigas engenheiras e pelas formigas operárias, incumbiria-se de fabricar uma catapulta que os 
arremessasse de volta ao seu formigueiro de origem. Para que nenhum imprevisto ocorresse quando do 
arremesso da rainha, as formigas engenheiras foram consultadas. Elas então criaram um modelo teórico 
de catapulta. A catapulta consistia em utilizar um pedaço de matinho de tamanho fixo. A rainha deveria 
ser colocada em uma ponta, com a catapulta inclinada em um determinado ângulo 0, e arremessada 
numa distância exata entre os formigueiros.No entanto, para que isso ocorresse, era necessário saber qual 
matinho usar. Algumas formigas então começaram a realizar testes com matinho de uma mesma espécie 
mas com diferentes diâmetros e verificaram que, para um alcance horizontal fixo igual à distância entre 
os formigueiros, o ângulo de arremesso variaria com o diâmetro do matinho, segundo a seguinte tabela 


de dados: 
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diâmetro ângulo 
1 40.03 
1.079 36.68 
1177 34.56 
1.290 33.21 
1.584 31.99 
1.511 31.33 
1.622 31.01 
1.766 30.46 


Para encontrar a melhor curva descrita por esses pontos as formigas engenheiras fizeram um programa 
que encontrava a melhor aproximação pelo método dos mínimos quadrados. Faça você o mesmo que as 
formigas engenheiras! 


8.15 - Um capacitor de capacitância C Farad, com carga inicial de q Coulomb está sendo descarregado 
através de um circuito elétrico que possui um resistor com resistência de R Ohms. Da teoria sabe-se que 
em um certo instante t > 0, a corrente I no circuito é dada por 


I = Ige” RO 


onde t = 0 é o instante em que o circuito é ligado e Io = q/RC. 


Os seguintes dados experimentais foram obtidos: 


ts) |1 2 3 4 5 6 7 8 
IA) [0.37 0.14 0.056 0.0078 0.003 0.001 0.00042 0.00022 


i) Calcule os desvios quadráticos médios: 


m 


DQM, = Dor — A — BE; 
DQM: = De — ae: )?]/m , 


onde Y; = Inl;, A= Ina, B=b e m éo número de pontos. Qual o significado desses desvios? 


ii) Qual o tempo necessário para que a corrente seja 10% da inicial? 


8.16 - Um modelo para o crescimento da população segundo Verhulst é que a população, P, cresce no 
tempo de acordo com a equação diferencial: 


dP 
=(A-BP) P. 
TA ) 


O parâmetro A é a taxa geométrica de crescimento para populações relativamentes pequenas. Entre- 
tanto, com o crescimento da população, há um efeito de retardamento ou freio causado pelo consumo 
do suprimento de alimentos, poluição do meio ambiente, e assim por diante. Este efeito de freio é 
representado pelo parâmetro B. 
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A solução desta equação diferencial é dada por: 


onde C é a constante de integração e pode ser determinada a partir da população inicial em t = 0. A de- 
terminação dos parâmetros A e B requer uma regressão do tipo que não pode ser linearizada. Entretanto, 
suponha que aproximemos: 


onde P; é a população no final do k-ésimo período de tempo; isto é, Pe = P(kAt) e At é o acréscimo do 
tempo. 
Então a equação diferencial, torna-se: 


Pon = (1 + AAt — BAtP}) Ph . 


i) Determinar os parâmetros A e B correspondentes aos dados a seguir, provenientes do censo 
em um país, onde P é dado em milhões: 


ano | 1930 1940 1950 1960 1970 1980 1990 
P [| 063 076 09 11 12 13 l5 


ii) Usando os valores de A e B encontrados no item i) faça a previsão da população no país no 


ano 2000. 


8.17 - A tabela a seguir relaciona a quantidade ideal de calorias, em função da idade e do peso, para 
homens que possuem atividade física moderada e vivem a uma temperatura ambiente de 20° C. 


il 25 45 65 


50 2500 2350 1950 
60 2850 2700 2250 
70 3200 3000 2550 
80 2550 3350 2800 


i) Usando o método dos mínimos quadrados encontre expressão da forma: 


cal = bp+ ci, 


que aproxime a tabela. 
ii) Determine a cota de calorias para um homem: 


a) de 30 anos e 70 quilos 
b) de 45 anos e 62 quilos 
c) de 50 anos e 78 quilos 


usando a expressão do item i). 
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8.18 - Uma refinaria pode comprar dois tipos de petróleo bruto: leve ou pesado . Os custos por barril 
desses tipos são respectivamente 110 e 90 (unidade adotada: reais). As seguintes quantidades de gasolina 
(G), querosene (Q) e combustível de avião (CA) são produzidas a partir de um barril de cada tipo de 
petróleo: 


G Q CA 
LEVE 0.4 0.2 0.35 
PESADO 0.32 0.4 0.2 


Note que 5% e 8% do petróleo bruto, leve e pesado, são perdidos respectivamente durante o processo 
de refinamento. A refinaria deve entregar 100 barris de Gasolina, 40 barris de Querosene e 25 barris de 
Combustível para aviões, sendo que há disponibilidade de 20 mil reais para a compra de petróleo bruto 
leve e pesado. O objetivo é determinar tais quantidades. Assim, denotando por x a quantidade de petróleo 
bruto leve e por y a quantidade de petróleo bruto pesado, em barris chegamos ao sistema: 


110x + 90y = 20000 
04% + 0.32y = 100 
02x + 04y = 40 
0.352 + 02) = 25 


que é um sistema incompatível. 

a) Usando o método dos mínimos quadrados determine x e y. 

b) Pode-se obter a e y como quantidades não inteiras? 

c) Calcule o resíduo, isto é: 
4 

2 
> (bi — ai £ — aa y)“ , 
i=1 
onde aij são os elementos da matriz do sistema e b; é o vetor independente. 


d) Quais as quantidades de gasolina, querosene e combustível para aviões produzidas? 


8.19 - O calor perdido pela superfície do corpo humano é afetado pela temperatura do ambiente e 
também pela presença do vento. Por exemplo, a perda de calor em —5º C acompanhada de um vento de 
10 km/h é equivalente à perda de calor em —11º C sem vento. Dada a temperatura t e a velocidade do 
vento v, pode - se calcular a temperatura t que na ausência do vento, tem o efeito resfriador equivalente. 

Considerando que vale a tabela: 


t| -10 -5 0 
v 
0 | -10 -5 0 
10 | -16 -11 -5 
20 | -22 -16 -10 
e supondo que vale aproximadamente: 
t= at + bv 


determine: 
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a) Os parâmetros a e b. 


b) A temperatura t equivalente à temperatura de —2º C e velocidade do vento de 5 Km/h. 


8.20 - A madeira com uma grande porcentagem de nós não é tão resistente quanto a madeira sem nós. 
Foram estabelecidas normas para determinar a relação de resistência entre uma viga com nós e uma viga 
sem nós. Para vigas ou pranchas os nós são medidos na face estreita da viga. A relação de resistência 
percentual R depende da largura L da face e do tamanho T do nó. Uma tabela parcial destas relações de 
resistência é dada a seguir. 


L| %5 100 125 150 
T 
12.5 85 90 125 150 
25.0 72 18 82 85 
37.5 57 67 13 1 
50.0 325 55 64 70 
65.5 18 47 56 61 


a) Encontre expressão da forma: 
R=-a+bT+ceL, 


que aproxime a tabela. 


b) Determine a proporção de resistência para nós de 45 mm com largura de face de 90 mm. 


Capítulo 9 


Programação não Linear 


Este Capítulo é do Marcos Arenales 
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Capítulo 10 


Aproximação de Funções: Métodos 
de Interpolação Polinomial 


10.1 Introdução 


A aproximação de funções por polinômios é uma das idéias mais antigas da análise numérica, e ainda 
uma das mais usadas. É bastante fácil entender por que razão isso acontece. Os polinômios são facilmente 
computáveis, suas derivadas e integrais são novamente polinômios, suas raízes podem ser encontradas com 
relativa facilidade, etc. 

A simplicidade dos polinômios permite que a aproximação polinomial seja obtida de vários modos, 
entre os quais podemos citar: Interpolação, Método dos Mínimos Quadrados, Osculação, Mini-Max, etc, 
portanto é vantajoso substituir uma função complicada por um polinômio que a represente. Além disso 
temos o Teorema de Weirstrass que afirma que: toda função contínua pode ser arbitrariamente aproximada 
por um polinômio. 

Veremos aqui como aproximar uma função usando Métodos de Interpolação Polinomial. 

Tais métodos são usados como uma aproximação para uma função f(x), principalmente, nas seguin- 
tes situações: 

a) não conhecemos a expressão analítica de f(x), isto é, sabemos apenas seu valor em alguns pontos 
To, Z1, X2,..., (esta situação ocorre muito frequentemente na prática, quando se trabalha com dados 
experimentais) e necessitamos manipular f(x) como, por exemplo, calcular seu valor num ponto, 
sua integral num determinado intervalo, etc. 


b) f(x) é extremamente complicada e de difícil manejo. Então, às vezes, é interessante sacrificar a 
precisão em benefício da simplificação dos cálculos. 


10.2 Polinômio de Interpolação 


O problema geral da interpolação por meio de polinômios consiste em, dados n + 1 números (ou 
pontos) distintos (reais ou complexos) x0,%1,...,%n € n+ 1 números (reais ou complexos) yo, Y1,-.-,Yn; 
números estes que, em geral, são n + 1 valores de uma função y = f(x) em zo, £1,..., Zn, determinar-se 
um polinômio P(x) de grau no máximo n tal que 


Vamos mostrar que tal polinômio existe e é único, na hipótese de que os pontos x9,%1,...,Yn sejam 
distintos. 
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Teorema 10.1 -Dados n+1 pontos distintos xo, £1,..., Un (reais ou complexos) e n+1 valores yo, y1,..-sYn 
existe um e só um polinômio Pa(x), de grau menor ou igual a n, tal que 


Palin) = ye, k=0,1,...,n. (10.1) 


Prova: Seja: 
Pla) = atarx+t...+a T”, 


um polinômio de grau no máximo n, com n + 1 coeficientes ag, a1,..., 4 a serem determinados. 
Em vista de (10.1), temos: 


ao == a1 To ... Ano = Yo 
ao E Q1ıťı .. An = Yi 
(10.2) 
ao + ut Fc... F Onin = Yn 
o qual pode ser interpretado como um sistema linear para os coeficientes ao, a1, . . - , Gn € cujo determinante, 
conhecido como determinante de Vandermonde, é dado por: 
l1 zo ... vg 
Lo Dio si SE 
V=Ví(zoam,...tn) = y (10.3) 
1 r ga 
Para se calcular V, procedemos da maneira seguinte: 
Consideremos a função V(x) definida por: 
1 To zo 
1 £1 r? 
Vis) = V (rotina DB) =E] ee wie ar ee | (10.4) 
À ted ees MA 
1 a sede g 


V(x) é, como facilmente se verifica, um polinômio de grau menor ou igual a n. Além disso, V(x) se 


anula em x0,%1,...,%n-1. Podemos, então escrever: 
V (£0, £1, ...,£n—-1;,£) = A(x — zo) (x — z1)... (£ — tn), (10.5) 
onde A depende de zo, £1,..., &n—1 - 


Para se calcular A, desenvolvemos (10.4) segundo os elementos da última linha e observamos que o 
coeficiente de x” é V (z0, £1,...,£n—1). Logo, 


V (£z0,...,£n—-1;,£) = V (z0,...,£n—1) (£ — T0)... (£ — tuo). (10.6) 
Substituindo £ por £n em (10.6), obtemos a seguinte fórmula de recorrência: 


V (£0, -..,Zn—1;2n) = V (£0,...,Zn—1) (in — T0)... (n — En-1) - (10.7) 
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De (10.3), temos que: V (zo, x1) = zı — xo. Em vista de (10.7) podemos escrever: 
Vízo,z1,72) = (x1 — xo)(xa — zo)(xo — 11) . 


Por aplicações sucessivas de (10.7), obtemos: 


Vigo msn) = [a — z). 


i>j 


Por hipótese, os pontos £o, £1,..., n são distintos. Assim V Æ 0 e o sistema (10.2) tem uma e uma só 
solução ao, 41, ..., an- 


Vimos, então, que dados n + 1 pontos distintos £0, £1,...,£n en + 1 valores f(x9) = yo, f(x1) = 
vi, (tn) = Yn de uma função y = f(x), existe um e um só polinômio P, (x) de grau no máximo n 
tal que 

Polte) = f(x) a k=0,1,...,n. 


Em vista disso, temos a seguinte definição. 


Definição 10.1 - Chama-se polinômio de interpolação de uma função y = f(x) sobre um con- 
junto de pontos distintos xo, X1,..., Un, a0 polinômio de grau no máximo n que coincide com f(x) em 
x0,%1,..-,%n- Tal polinômio será designado por Pa(f;x) e, sempre que não causar confusão, simples- 
mente por Pa(a). 


Exemplo 10.1 - Dados os pares de pontos: (—1,15): (0,8); (3,1), determinar o polinômio de inter- 
polação para a função definida por este conjunto de pares de pontos. 


Solução: Temos: 


zo = —1, yo = 15 = f(xo), 
zı = 0, e y =8 = f(m), 
t2 = 3, y2 = -1 = f(x). 
Como n = 2, devemos determinar P(x) = ao + a1 £ + az z?, tal que P2(£k) = yk, k = 0,1,2, isto é: 


7 us 

ao T Q1 To T Q2 To = Yo 
2 — 

agrada Ty T Q2 ti = Yı 
2 a 

ao T Q1 T2 alo = Y2 


Substituindo £k e yk, k = 0,1,2, obtemos: 


ao — q + a2 = 15 

ao = 8 

ao + 3a, +9a = 9 
cuja solução é: ao = 8, a = —6 e az= 1. Assim: 


Pz) = 8 - 6z+ r°, 
é o polinômio de interpolação para a função dada pelos pares de pontos: (—1,15); (0,8); (3,—1) 


Observações: 
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a) Observe que nos pontos tabelados, o valor do polinômio encontrado e o valor da função, 
devem coincidir. Se os valores forem diferentes você terá cometido erros de cálculo. 


b) A determinação do polinômio de interpolação por meio de solução de sistemas é muito 
trabalhosa, além de poder ocorrer erros de arredondamento, fazendo com que a solução obtida seja 
irreal. Vamos, por isso, procurar outros métodos para determinação deste polinômio. 


10.3 Fórmula de Lagrange 


Sejam x9,%1,...,Yn Nn +1 pontos distintos. Consideremos para k = 0,1,...,n, os seguintes po- 
linômios (x) de grau n: 


o  (£— zo)... (£ — £k—1) (£ — xpa)...(x— Tn) 
Cala) E: (£k e a (£k E (ar — Tn) (10.8) 


É fácil verificar que: 
0, se k#j, 
lk (x;) = Ôkj = (10.9) 
l, se k = 3. 


De fato: substituindo z por xy em (10.8) vemos que se o numerador e o denominador são exatamente 


iguais > l(xķ) = 1. Agora se substituímos x por x; com j  k vemos o numerador anula-se e assim 
Cela) =0. 


Para valores dados: fo = (xo), fi = f(x1), ..., fn = f(£n) de uma função y = f(x), o polinômio: 
Palo) = X` fr tule), (10.10) 
k=0 
é de grau no máximo n e, em vista de (10.9), satisfaz : 
Palt) = fe, k=0,1,2,...,n. 
Logo P(x), assim definido, é o polinômio de interpolação de f(x) sobre os pontos zo, £1,..., Ln. 


A fórmula (10.10) é chamada Fórmula de Lagrange do Polinômio de Interpolação. 


Exemplo 10.2 - Conhecendo-se a seguinte tabela: 


z |—1 0 3 
fæ) | 15 8 -1 


a) Determine o polinômio de interpolação na forma de Lagrange. 


b) Calcule uma aproximação para f(1), usando o item a). 


Solução: Temos: 


to = —1 , fo = f (z0) = 15 , 
To = 0, e fı = f (z1) = 8, 
t2 = 3, fo = f (z2) = —1 
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e, portanto, n = 2. Assim, o polinômio de interpolação na forma de Lagrange é dado por: 


Pa) = X. fr lula). 
k=0 


Determinemos os polinômios tk(x), k = 0,1,2. Temos: 


bio = (x — x1) (x — x2) ” (x — 0) (x —3) a 2-3 x 

i (zo — x1) (zo — z2) (-1-0)(-1-3) 4 

LE = (x — xo) (x — x2) o (x+ 1) (x —3) n r -227—3 

! (z1 — xo) (£1 — z2) (0+1)(0—3) 53 

A (x — xo) (x — x1) (x +1) (x —0) r? +r 

í © (£2— zo) (z2— 21)  (3+1)(3-0) 12 
Portanto: 

Pa) = fololz) + fi tilz) + fa talz) = 


2 2 
— 15 x [22] LBX |z =] -1x [z +] 
Agrupando os termos semelhantes, segue que: 
Plz) = z? — 67 +8. 


Uma aproximação de f(1) é dada por P5(1). Assim, usando o algoritmo de Briot-Ruffini, (Capítulo 3), 
obtemos: 


1 —6 8 
1 1 —5 
1 —5 3 


Logo: 
0) = R) = 3. 


Observe que podemos obter f(1) efetuando o seguinte cálculo: (1) = 12 — 6 x 1+8 = 3. É claro que 
este tipo de cálculo só deve ser utilizado para obter o resultado quando resolvemos o problema a mão. O 
anterior além de também poder ser utilizado a mão deve ser usado em computadores. 


Vimos então que para obter o valor da função num ponto não tabelado, podemos aproximar a função 
por seu polinômio de interpolação e através deste ter uma aproximação do valor da função no ponto. 
Veremos agora um esquema prático para calcular o valor do polinômio de interpolação num ponto (não 
tabelado) sem determinar a expressão do polinômio. 


Consideremos a fórmula de Lagrange, (10.10), e a fórmula dos f(x), (10.8). 


Fazendo: 
Tn 1(x) = (x = zo) (x Fe 71) SE (x = Tn) , 


podemos escrever: 


o Tn+1(2) 
lk(z) = CER Cs (10.11) 
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onde: 7) (1x) é a derivada de mnyai(x) avaliada em g= xp. 


Primeiramente, calculamos as diferenças: 


T — To Tto — Tı To— T2 ... LO— Tn 
zı — To T — Ei Ti — T3 ss Em La 
T2 — Lo Ta — Ti X— Lg o L— Ln 
Tn — Tto Tn— Tı TnT? ... T— Tn. 


Denotamos o produto dos elementos da primeira linha por Do, o da segunda por Dı e assim por 
diante. Observe que o produto dos elementos da 12 linha é exatamente o denominador de lọ(x) em 
(10.11), o produto dos elementos da 2º linha, o denominador de 41 (x), etc. O produto dos elementos da 
diagonal principal será, obviamente, IL, (x) e, então, segue que: 


dire; CER. saio 


n. 
Dk i 


El 


Assim, a fórmula de Lagrange se reduz a: 


onde: 


Portanto, podemos obter o valor do polinômio num ponto, não tabelado, através do seguinte: 
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Esquema Prático 


k (au — x) (k £i) Dk f | É 
0| x zı Xo— T2 £o — Tn | (z — xo) [[;=0(£0 — x:) | fo fe 
10 o 
1| t zı T1 — T2 «qr | (x — z1) [[i=0(21 — z:) | fı o 
itl 1 
2 T2 zı L— T2 ... T2— Tn (x — x2) Į [i-o (£2 — x;) | fo $ 
12 2 
n | £n £i Tn — T2 . L— En | (£— zn) [3-0 (£n — x) | fn f 
ifn n 
Tnıl£) = (x — zo) (x — z1)... (£ — En) S 
Note que no esquema acima , acrescentamos mais três colunas: uma com o resultado dos produtos 


das linhas , a próxima com o valor de fp e finalmente a última coluna com o valor de fk/Dp. A soma 
desta última coluna fornece o valor S. 


Exemplo 10.3 - Aplicar o esquema acima ao exemplo anterior, isto é, calcular f(1), sabendo que: 


E 0 3 


fw)| 15 8 a 


Solução: Montamos o esquema: 


k (Ek — 2) De | fk fe/ Di 
oļ2 -1-4| 8/15 15/8 
1l 1 1-3 | -3l 8 -8/3 
2 4 3 —2 24 1 1/24 
ma) = —4 S==3/ 
k | (£ze=>zi) | Dk | fk fe/ Dk 
ol2 -1-4| 8 |15| 15/8 
ılı disso] go] -8⁄3 
2|4 3-2 | —24 | —1 1/24 
ma) = 4 5==3/ 


Assim, obtemos: P>(1) = ma(1) x S 


= (—4) x (=3/4) = 3 


, e portanto f(1) = P(1) = 3. 
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Exercícios 


10.1 - Considere a tabela: 


f(x) | 0 6 24 60 
a) Determinar o polinômio de interpolação, na forma de Lagrange, sobre todos os pontos. 
b) Calcular f(3.5). 


10.2 -Construir o polinômio de interpolação, na forma de Lagrange, para a função y = sen Tz, esco- 
lhendo os pontos: £o =Q ; 7 = gin = 5. 


10.3 - A integral elíptica completa é definida por: 


mia dx 
K(k) = / 1/2 
0 (1 — k2sen2x) 


Por uma tabela de valores dessa integral encontramos: 


K(1) = 1.5708; K(2) = 1.5719; K(3) = 1.5739 . 


Determinar K(2.5), usando polinômio de interpolação, na forma de Lagrange, sobre todos os pontos. 
10.4 - Calcular e°! usando a Fórmula de Lagrange sobre 3 pontos e a tabela: 


T | 2.4 2.6 2.8 3.0 3.2 3.4 3.6 3.8 
e” | 11.02 13.46 16.44 20.08 24.53 29.96 36.59 44.70 


3-1 usando 3 pontos, devemos escolher 3 pontos consecutivos na vizinhança 


Observe que como queremos e 
de 3.1. Assim temos duas opções. Ou escolhemos: zo = 2.8, zı = 3.0 e z = 3.2 ou então: xy = 


3.0, xı =3.2 e x) = 3.4. Em ambos os casos o erro na aproximação será da mesma ordem de grandeza. 


10.5 - Sabendo-se que e = 2.72,/e = 1.65 e que a equação x — e” = O tem uma raiz em [0,1], 
determinar o valor dessa raiz, usando a Fórmula de Lagrange sobre 3 pontos. 


10.6 - Dar uma outra prova de unicidade do polinômio de interpolação Pa(f; x) de uma função y = f(x) 
sobre o conjunto de pontos £o, £1,..., En- 
Sugestão: supor a existência de outro polinômio Qn(f;x) que seja de interpolação para f sobre 
Zo, X1,...,Yn € considerar o polinômio: 


10.4 Erro na Interpolação 


Como vimos, o polinômio de interpolação P,(x) para uma função y = f(x) sobre um conjunto de 
pontos distintos x0,%1,...,%Yn tem a propriedade: 


Pa (£k) = fe, k=0,1,...,n. 


Nos pontos Z Æ £k nem sempre é verdade que Pa (z) = f(x). Entretanto para avaliar f(x) nos pontos 
T Æ £k, k=1,2,...,n, consideramos P (x) como uma aproximação para a função y = f(x) num certo 
intervalo que contenha os pontos £0, £1,..., 2n € calculamos f(z) através de P,(Z). Perguntas que surgem 
são, por exemplo, as seguintes: é o polinômio de interpolação uma boa aproximação para f(x)? Podemos 
ter idéia do erro que cometemos quando substituimos f(x) por Pa(x)? Estas e outras perguntas são 
respondidas quando estudamos a teoria do termo do resto. Para isso, introduziremos dois lemas, cujas 
demonstrações podem ser encontradas em livros de Cálculo ou Análise Matemática. 
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Lema 10.1 -Teorema de Rolle - Seja f(x) contínua em [a,b] e diferenciável em cada ponto de (a,b). 
Se f(a) = f(b), então existe um ponto x = £,a < E < b, tal que FE) = 0. 


Prova: Pode ser encontrada em [, 19]. 


Lema 10.2 -Teorema de Rolle generalizado - Seja n > 2. Suponhamos que f(x) seja contínua em 
a,b] e que f("-D(x) exista em cada ponto de (a,b). Suponhamos que f(a1) = f(xo) =... = 0 para 
a<r<r<..<zn<b. Então existe um ponto E, £1 < ÊE < £n, tal que FV (£) = 0. 


Prova: Pode ser encontrada em [, 19]. 
Vejamos agora um teorema que nos dá expressão do termo do erro. 


Teorema 10.2 - Seja f(x) contínua em [a,b] e suponhamos que f~t (x) exista em cada ponto (a,b). 
Se a< zo < zı <... < un <b, então 


Rn(f; £) = f(£) — Pal f; x) = E peu E, (10.12) 
onde Mmin{zx, £o, £1,..., £n} < E< Mmaz{zx, zo, z1,..., n}. O ponto É depende de z. 


Prova: Sendo Pa(f; £k) = fk, a função Rn(f;x) = f(x) — Pa(f; x) se anula em z = gg, k=0,1,...,n. 
Seja x fixado e tal que x Æ zk, k = 0,1,..., n. 
Consideremos as funções K(x) e F(t), definidas por: 


Ha) — Pa(f; 2) 


K(x) = CEE E dd var, k=0,1,...,n, (10.13) 
e 
F(t) = f(t) — Pal f; t) — (t — zo) (t — z1)... (t — zn) K(a). (10.14) 
A função F(t) se anula nos n + 1 pontos t = zọ, t = £1, ..., t= £n. Anula-se também em t = x, em 
virtude de a Pelo Lema 10.2, a função F+» (t) se anula em um ponto é = &(x) tal que: 


min {z£, £0, Z1;,...,Zn} < E < maz {zx, £0, dt... Ln}. 
Calculando então F+» (t), tendo em vista (10.14), obtemos: 
FOD) = fOD — (n+1)! K(x). 
Então, substituindo t por é, segue que: 
0 = f0+D(g) =at GER). 


Portanto: 


(n+1) 
K(x) = N. (10.15) 


Comparando (10.15) com (10.13), temos, finalmente: 


Rn(f:0) = f(e) = Pafin) = (E tOltE= A (o eo, 


onde min {x£, £0, £1,...;,£n} < E < maxrtr, z0, £1,..., Zn} , O que demonstra o teorema. 
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Em vista de (10.12) podemos escrever: 
f(x) = Palfiz) + Ralf; a). (10.16) 


O termo Rn(f; x) na expressão (10.16) é chamado termo do erro ou erro de truncamento. É o erro 
que se comete no ponto x, quando se substitui a função por seu polinômio de interpolação calculado em 
T: 

A importância do Teorema 10.2, é mais teórica do que prática, visto que não conseguimos determinar 
o ponto ¿ de tal modo que seja válida a igualdade em (10.12). Na prática, para estimar o erro cometido 
ao aproximar o valor da função num ponto por seu polinômio de interpolação, utilizamos o seguinte 
corolário. 


Corolário 10.1 - Seja 
Ra(f; 2) = f(x) — Pa(f; 2). 


Se f(x) e suas derivadas até ordem n + 1 são contínuas em |a, b], então 


|x — zo| |z — zı|... |£ — zrl (n+1) 
h max D0) (10.17) 


|Ra(f;æ)| < 
Prova: A demonstração fica como exercício. 
Exemplo 10.4 Dada a tabela: 


x |o 01 0.2 0.3 0.4 0.5 
er |1 1.3499 1.8221 2.4596 3.3201 4.4817 


calcular um limitante superior para o erro de truncamento quando avaliamos f(0.25), onde f(x) = x e?” 


usando polinômio de interpolação do 2º grau. 


Solução: "Temos, de (10.17): 
la — xo] |æ — zı| |£ — z2 


|Ra(f;£)| < max |f(t)|. 


3! xzolt<r2 


Como f(t) = t e3!, segue que: 


ft) = etsgtet = e (1+83t), 

F'O = 3e” (1+3t)+3e* = 6e +9te”, 

tt) = 18 e% +9 e” +27te” = 27e” (+). 
3s 


Como queremos estimar o valor da função x e no ponto 0.25 usando polinômio do 2° , devemos 
tomar 3 pontos consecutivos nas vizinhanças de 0.25. Tomando então: xo = 0.2, xı = 0.3 e z3 = 0.4, 
obtemos que: 

max |f] = 2709) (1+0.4) = 125.4998 


ToLt<r2 


Estamos portanto em condições de calcular um limitante superior para o erro de truncamento. Assim: 


0.25 — 0.2)| |(0.25 — 0.3)| |(0.25 — 0.4 
strap Pae e] 


(125.4998) 


0.0078 = 8x 1078. 


K 
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Pelo resultado obtido, vemos que se tomarmos um polinômio do 2º para avaliar f(0.25), obteremos o 
resultado com duas casas decimais corretas. 
Observações: 


a) O número de zeros depois do ponto decimal, no resultado do erro, fornece o número de casas 
decimais corretas que teremos na aproximação. 


b) Observe que poderíamos ter tomado: xo = 0.1, xı = 0.2 e «3 = 0.3. Se tomarmos esses 
pontos, obtemos que |R2( f; x) = 0.0054 = 5x 107% o que implica que obteremos duas casas decimais 
corretas na aproximação. Assim tanto faz tomarmos um ponto a esquerda, e dois a direita de 0.25, 
ou dois pontos a esquerda e um a direita, que o erro será da mesma ordem de grandeza. 


Exercícios 


10.7 - Seja f(x) = 70º — 3z? — 1. 


a) Calcular f(x) nos pontos x = 0; x = +1; x = +2; x = +3 (usar o algorítmo de Briot- 
Ruffini). Construir a seguir a tabela segundo os valores crescentes de x. 


b) Construir o polinômio de interpolação para esta função sobre os pontos —2; —1; 0; 1. 


c) Determinar, pela fórmula (10.17), um limitante superior para o erro de truncamento em 
x = —0.5 e x = 0.5. 
10.8 - Conhecendo-se a tabela: 


s | 08 09 10 11 13 15 
cos æ | 0.6967 0.6216 0.5403 0.4536 0.2675 0.0707 


calcular um limitante superior para o erro de truncamento quando calculamos cos 1.05 usando polinômio 
de interpolação sobre 4 pontos. 


10.9 - Um polinômio Pa(x), de grau n, coincide com f(x) = e” nos pontos 0, L ot L É. Qual 
o menor valor de n que se deve tomar a fim de que se tenha: 


Je” — Pa(x)| < 107º , para 0<x<1? 


10.5 Interpolação Linear 
No caso em que se substitui a função f(x) entre dois pontos a e b por um polinômio de interpolação 
Pi(ax) do 1º grau, tal que Pı (a) = f(a) e P(b) = f(b) diz-se que se fez uma interpolação linear entre 


aeb. 


Neste caso, em que n = 1, a fórmula (10.10) se reduz, sucessivamente, a: 


Pa) = $ fale) = fo-to(x) + fitila) = 
k=0 


o £ — Tı zr— zro x—b v—a 
= a Lti — To = Ho) CA rr 
= = ia q 


b—a 
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Assim, vemos que P(x) pode ser escrito na forma de determinante, isto é: 


o O z-bj_ 1 fla) a-z 
P(x) al du poa feat S (10.18) 
Se f(x) é contínua em [a,b] e f(x) existe em cada ponto de (a,b), temos, para a < x < b, que: 
Rı(f;x) = f(z) — (fio) = o Ein FE), a<E<b. (10.19) 


2! 


Podemos determinar, no caso de interpolação linear, além do resultado obtido em (10.17), o seguinte: 
consideremos e suponhamos, além disso que f”(x) seja contínua em [a,b]. O polinômio |(a — 
a)(a — b)| atinge seu máximo, para a < x < b, em x = z(a + b) e este máximo é 7(b — a)2. Podemos, 
então, escrever: 


1 (b-a) 
RD s i CE mas O, (10.20) 
ou 1 
|Ri(£)| < E (b-a)? Mı, (10.21) 


onde M, é um limitante superior para f” (t) em [a,b]. 


Exemplo 10.5 - Usando a tabela do exemplo[10.4, calcular f (0.25) através de interpolação linear e dar 
um limitanter superior para o erro de truncamento. 


Solução: Da tabela do exemplo anterior, temos: 


a = 02, f(a) = 0.3644 , 
e 
b = 0.3, f(b) = 0.7379 , 
desde que f(x) = x e”. Assim, usando (10.18), segue que: 
1 |f@) a-z] _ 1 0.3644 0.2 — 0.25 
BUD) = a fo) be O a- | 0.7379 0.3 — 0.25 


1 
= gg X 0.05 x (0.7379 + 0.3644) . 


Logo: 
P, (0.25) = 0.5512 ~ f(0.25). 


Agora, pelo Exemplo 10.4, temos que: f” (t) = et (6 +9) t. Portanto 
max |f”(t)| = 2.4596(6 + 2.7) 


a<t<b 


= 21.3985 = Mı. 
Segue, de que: 
R| < 5 (03-02? x 21.3985 = 0.02673 = 2 x 1072. 
Isto significa que no resultado obtido para f(0.25) através do polinômio de interpolação linear temos 


apenas uma casa decimal correta. De fato, o resultado obtido foi f(0.25) = 0.5512 e se calcularmos o 
valor da f no ponto 0.25, numa máquina de calcular, obtemos que f(0.25) = 0.52925. 
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Exercícios: 


10.10 - Sabendo-se que 1.03 = 1.0149 e v1.04 = 1.0198, 
a) calcular 1.035, por interpolação linear, 


b) dar um limitante superior para o erro de truncamento. 


10.11 - O valor de log1912.7 foi computado por interpolação linear sobre os pontos 12 e 13. Mostrar 
que o erro de truncamento é < 0.004. 


10.12 - Seja a tabela: 
z|0 01 0.2 03 04 05 
e? [1 1.11 1.22 1.35 149 1.65 


Usando interpolação linear sobre pontos adequados: 
a) Calcular f0.35 onde f(x) = v2e”. 


b) Dar um limitante superior para o erro de truncamento. 


10.6 Fórmula para Pontos Igualmente Espaçados 


Quando os pontos x;, são igualmente espaçados deh Æ 0, isto é, zi+ı— £; = h, i = 0,1,...,n—1, onde 
h é um número fixado, há interesse, para futuras aplicações, em se determinar uma forma do polinômio 
de interpolação e do erro, em termos de uma variável u, definida da seguinte maneira: 


£ — To 
Zoe 10.22 
u= (10.22) 


Em função da variável u, temos os seguintes teoremas. 
Teorema 10.3 - Para r inteiro, não negativo, 
rr = (u-r)h. 


Prova: (provaremos por indução em r). Assim: 


a) Para r = 0, temos, de (10.22), que: 


b) Supondo válido para r = p, isto é, 
£— Tp = (up). 


c) Provemos que vale também para r = p + 1. 


Temos: 
T — lp = T—Tp + Tp — Toy 


= g£—Tp — (Tp+1— 2p) = (u—p)h—h 


= (u-p-Dh = (u—(p+1))h. 


Portanto o teorema vale para todo inteiro r > 0. 
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Teorema 10.4 Parar e s inteiros, não negativos: 
Zr — zs = (r—s)h. 


Prova: A prova, por ser semelhante à do teorema anterior, fica como exercício. 


Consideremos o polinômio de interpolação de f(x) sobre zo, x1,..., £n, dado por (10.10), isto é: 


Pala) = 5 fk (x — £o) (£ — £1)... (£ — £k—1) (£ — Lk41) (£ — Tn) 


am (£k — £0) (£k — T1)... (Lk — Tr) (Lk — Lai) e (Ek — En) 

Fazendo a mudança de variável dada por (10.22) e usando os resultados dos teoremas 10.3 e 10.4, obtemos: 
E) .. (u — (k — 1))(u — (k + 1)) ... (u — n) 

Pa (xo + uh) fe , 
-5 EN (k — D))(k — (k+ D)...(k—n) 


que é a forma de Lagrange do Rs de interpolação para argumentos x; igualmente espaçados de 


ho. 


(10.23) 


Esta forma do polinômio de interpolação é particularmente útil na determinação de fórmulas para 
integração numérica de funções. 


De modo análogo, substituindo x — £y por (u — r)h em (10.12), obtemos: 


hrt! 
Ra(x) = Rn (zo + uh) = ulu -— 1)... (u-n) mri JED (8, (10.24) 
onde 
min (t topsin) < É Smat (2 fizier atn) a 
Temos que: 
n+1 
pg = Z TO 
dar+1 = E ? 
mas se preferirmos exprimir f(x) em termos de u, teremos: 
arH f 1 dart 
dart = hr durt! ? 
e assim: E 
—D...(u— d” 
mo = Deum) arms 
(n + 1)! du”! | u=7 
onde n = £ e pertence ao intervalo (0, n), se supusermos os pontos £o, £1, ..., n em ordem crescente 
ex E (z0, £n). 
Como vimos, o polinômio de interpolação para f(x) sobre n + 1 pontos £o, £1, ..., En Se escreve, em 
termos deu = “ Th como: 
P, (zo + uh) = X Arlu) fr, (10.25) 
k=0 


onde: 


1)... "E ) 
E TD)... EF ' (MaB 
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Exemplo 10.6 - Dada a tabela, do Exemplo 


3r 


a) calcular f(x) =x e’? no ponto x = 0.25 usando polinômio de interpolação sobre 3 pontos. 


b) dar um limitante superior para o erro de truncamento. 


Solução: Inicialmente escolhemos os 3 pontos apropriados na tabela dada e a seguir construimos a 
tabela de f(x) = x e”, Seja então: xo = 0.2, xı = 0.3 e z= 0.4. Assim: 


x | 02 03 04 
ze” | 0.3644 0.7379 1.3280 


a) De (10.26), temos: 


u— D(u—2 u-3u 
lu) = ERE) = aa 
nto) = ds = CcÊt, 

u(u — 1 uu 
Aa(u) = SS = J 


Usando (10.25), obtemos: 


2 
P> (zo+uh) = 5 fkàklu) 
k=0 


2. 
= (0.3644) x doa 
+ (0.7379) x (~u? + 2 u) 


+ (1.3280) x u . 


Agrupando os termos semelhantes, segue que: 
P> (zo +uh) = 0.1083 u? + 0.2652 u + 0.3644. 


Queremos calcular f (0.25). De (10.22) temos: 


_ T-T 5 „= 02—02 o 
h © Ol 


Usando o algorítmo de Briot-Fuffini: 


0.1083 0.2652 0.3644 
0.5 0.0542 0.1597 
0.1083 0.3194 0.5241 


Então P»(0.5) = 0.5241 ~ f(0.25). 


b) De temos: 
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Analogamente a (10.17), podemos escrever: 
3 


h 
Ralo) < ellu- Du Dl o me, O 


onde: u = 0.5, h = 0.1 h? = 0.001 e pelo exemplo 10.4, temos que: 
tt) = 27 e* (1+t)> max |[f“(t)| = 125.4988. 


0.2<t<0.4 
Portanto: 
|Rə(u)| < [0.5] (0.5-n||(0.5-2)] x &901 x (5.066) = 
= 0.0078 = 8x 1078 
Observações: 


a) Se compararmos o valor obtido para f(0.25) com o valor exato veremos que o resultado está 
com duas casas decimais corretas. 


b) O polinômio de interpolação obtido neste exemplo está em função da variavél u. Assim não 
é possível verificar se o valor do polinômio nos pontos tabelados coincide com a valor da função 
nesses pontos. Entretanto como a função é crescente no intervalo [0.2, 0.4], o valor para f(0.25) 
deve estar entre [0.3644, 0.7379]. 


Observe que quando se conhece a expressão analítica da função, o termo do resto, fornece uma estimativa 
sobre o número de casas decimais corretas que podemos obter na aproximação. Além disso, a aplicação 
da fórmula do termo do resto é útil quando queremos o resultado com uma precisão pré-fixada, como 
mostraremos no exemplo a seguir. 


Exemplo 10.7 - Determinar o número de pontos necessários para se obter xe?®, x € [0,0.4] com duas 
casas decimais corretas usando interpolação linear sobre pontos igualmente espaçados de h. 


Solução: Por (??, temos que: 


(b— a)? 
8 


h2 
Ri < M, = EM < 0.5 x 1072, 


desde que b— a = h, pois os pontos são igualmente espaçados, e o erro deve ser menor ou igual a 0.5x 1072, 
pois queremos o resultado com duas casas decimais corretas. Agora, 


— ZA o 3t = 
M = max |f"(t)| = e” (6 + 9t) = 31.873 


Portanto 


h2 
-y (81-873) < 0.5 x 107? 


> h? < 0.001255 


= h < 0.00354 . 


Para determinar o número de pontos basta lembrar que o intervalo dado é: [0, 0.4], e portanto o número 
de pontos será obtido fazendo: 


nal n = E 1999 = 12. 
0.0354 


Observe que n assim obtido é o índice do último ponto, e como tal deve ser um inteiro. Portanto o 
número de pontos necessários é n + 1, ou seja, 13. 


h = 
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Exercícios 
10.13 - Seja a função f(x) dada pela tabela: 


x| -1 


01 
fa|-4 12 


Calcular f(0.5) usando polinômio de interpolação para argumentos igualmente espaçados. 


10.14 - Dada a função f(x) = 41º — 2x + 2, tabelá-la nos pontos x = 0; z = 1 ; 
o seu polinômio de interpolação no intervalo |—2; 2]. 


x = +2 e construir 


10.15 - Determinar o único polinômio de grau menor ou igual a 3, que coincide com f(x) nos seguintes 
pontos: 


f0.5)=2: f(0.6)=8; On f(0.8)=5 
Calcular também f(0.56). 


10.16 - 4 função 


é dada pela seguinte tabela: 


z | 0 0.01 0.02 0.03 0.04 0.05 0.06 
y | œ 4.0379 3.3547 2.9591 2.6813 2.4679 2.2953 


Calcular y para x = 0.0378 usando polinômio de interpolação sobre 4 pontos. 
10.17 - Dada a função f(x) = we”! e a tabela: 


z | 2 225 25 2.75 30 
e”/2 | 2.71 308 349 3.96 4.48 


a) Calcular o polinômio de interpolação sobre todos os pontos. 
b) Calcular f(2.4). 


c) Dar um limitante superior para o erro de truncamento. 


10.7 Outras Formas do Polinômio de Interpolação 


O método de Lagrange para determinação do polinômio de interpolação de uma função y = f(x) 
sobre um conjunto de pontos £o, %1,..., n possui um inconveniente. Sempre que se deseja passar de 
um polinômio de grau p (construído sobre p + 1 pontos) para um polinômio de grau p + 1 (construído 
sobre p + 2 pontos) todo o trabalho tem que ser praticamente refeito. Seria interessante se houvesse 
possibilidade de, conhecido o polinômio de grau p, passar-se para o de grau p + 1 apenas acrescentando- 
se mais um termo ao de grau p. Vamos ver, agora, que tal objetivo é alcançado através da forma de 
Newton do polinômio de interpolação. Para a construção do polinômio de interpolação por este método, 
precisamos da noção de diferença dividida de uma função. 
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10.7.1 Diferença Dividida 


Definição 10.2 - Sejam xo, %1,..., Un, nt pontos distintos no intervalo [a, b] e sejam fo, f1,..., fn, n+ 
1 valores de uma função y = f(x) sobre x = zp, k=0,1,...,n. Define-se: 
f [xx] e f (zk) b) b=0,1,.0.,n; 
titne 5X] — flxoTi,...Un- 
flxo,x1,...,%n] FI ! 2 Ri 1 2 1 , 
onde flxo,%1,...,%n] é a diferença dividida de ordem n da função f(x) sobre os pontos Lo, £1,..., Un. 


Assim, usando a definição, temos que: 


— lz] - f [zo] 


f [z0 £1] = i do ’? 


f [£0, £1, £2] = fon. cal — eo m) 


di To, TX — Lo. LI. £ 
Í [£0, £1, £2, £3] = f [z1,22, a 0 T1, 2] 


Observe que do lado direito de cada uma das igualdades acima devemos aplicar sucessivamente a definição 
de diferença dividida até que os cálculos envolvam apenas o valor da função nos pontos, isto é, 


fixa, £2] — f [£0, x1] 


f [x0, £1, £2] 


T2 — To 
f(z2) — flar Fai) — (xo) 
= T2 — Tı Tı — To 
X2 — Lg 


Entretanto, podemos calcular as diferenças divididas de um função, de uma maneira mais simples. 


10.7.2 Cálculo Sistemático das Diferenças Divididas. 


Para calcular as diferenças divididas de uma função f(x) sobre os pontos zo, £1,..., Ln, construímos 
a tabela de diferenças divididas: 
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Tabela de Diferenças Divididas 


Ti fai] [zi £] fig £j, £k] 
xo | f [zo] = fo 
flo, qm) = U Ae 
xı | fle] = fi f [£0, £1, £2] = Í Tato] = from 
f lenz] = HEA fiel 
vo | f [z2] = fo Fei, ca, as] = É torto) — fim, to 
fla, aa] = Hel — flo 
z3 | f [z3] = fs f [£2, £3, £4] = ú torta) | lenta 
F [£3, £4] = 'i A 
as | flea] = fa 
da seguinte maneira: 
a) a primeira coluna é constituída dos pontos £k, k = 0,1,...,n; 
b) a segunda coluna contém os valoress de f(x) nos pontos £k, k = 0,1,2,...,n; 
c) nas colunas 3,4,5,..., estão as diferenças divididas de ordem 1,2,3,.... Cada uma dessas diferenças 


é uma fração cujo numerador é sempre a diferença entre duas diferenças divididas consecutivas e de 
ordem imediatamente inferior e cujo denominador é a diferença entre os dois extremos dos pontos 
envolvidos. 


Exemplo 10.8 - Para a seguinte função tabelada: 


z |-2 -1 01.2 
|-2 29 30 31 62 


construir a tabela de diferenças divididas. 


Solução: Usando o esquema acima temos que: 


xi | f [z] $ [zi x;) F [£i, £3, £k] Fiora S eiet] 
2/2 
BD a 
Lan - 

129 ES 15 

30.20 =] - = E 
0! 30 TR l-1 0 E 5—5 | 

==) 2 — (—2) 

31-30 1 Pae 
1| 31 31-1 -15 
2] 62 
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Assim, o elemento 0, corresponde à diferença dividida f |x1, £2, £3]. Portanto usando a definição, se- 


gue que: f[x1,%2,%3] = f [no ea) = Pi la, z2] e usando o item c) acima, temos que: f [z1, £2, £3] = 


TD —º 


Observação: Como veremos adiante, os resultados a serem utilizados na construção do polinômio de 
interpolação na forma de Newton são os primeiros valores em cada coluna de diferenças embora tenhamos 
que construir toda a tabela pois os valores não são independentes uns dos outros. 


10.7.3 Alguns Resultados sobre Diferenças Divididas 


Teorema 10.5 - As diferenças divididas de ordem k de uma função f(x), satisfazem: 


= f [zo] 

Firan S (xo — z1) (£o — £2) . . . (£o — Lp) 
y fla] 

(xı me zo) (xı ui z2) E (xı g zk) 


f [xx] 


(£k — xo) (£k — T1) --. (Lk — £k — Ek—1) 


Fe T 


Corolário 10.2 - As diferenças divididas de ordem k de uma função f(x), satisfazem: 


Í [£0, £1,- --, £k] = f [torth Ej] , 


onde (jo,J1,---,)k) É qualquer permutação dos inteiros (0,1,..., k). 


Corolário 10.3 - As diferenças divididas de ordem k de uma função f(x), satisfazem: 


f [£0, £1,..., £k] = 


F Bodega sea] = f [z£0,.--,£j—1, re] Aj 
Tj — Ti L Jh 
Observações: 


a) O Corolário 10.2 afirma que a diferença dividida de f(x), é uma função simétrica de seus 
argumentos, isto é, independe da ordem dos pontos x9,%1,...,Tk- 


b) O Corolário 10.3 afirma que podemos tirar quaisquer dois pontos para construir a diferença 
dividida de uma função, e não necessariamente o primeiro e o último. 
10.7.4 Fórmula de Newton 


Para obtermos a forma de Newton do polinômio de interpolação precisamos inicialmente definir al- 
gumas funções. Para tanto, consideremos que f(x) seja contínua e que possua derivadas contínuas em 
la, b], e além disso, que os pontos x9,41,...,Xn sejam distintos em |a, b]. Definimos então as funções: 
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(D)  f[zo, x] = He =r ea, definida em [a,b], para x £ xo. 


(2) f [zo, z1, £] = Proa) -F [otal definida em [a,b], 


Tt — Tı 


para £ Æ £o e x Æ a. 


Toties annt] =f [Bo Dig es 


definida em [a,b], para z £ zk, k=0,1,...,n. 


Observe que nas funções definidas acima acrescentamos, sucessivamente, na diferença dividida o 
próximo ponto da tabela. Em todas estamos aplicando o Corolário 10.3. Nosso objetivo agora é en- 
contrar uma fórmula de recorrência para f(x). Assim, de (1) temos que: 


Ha) = f[zo] + (x-— zo) f [zoz] . 
De (2), (usando (1)), obtemos: 


Í [£0, £1, x] (x — x1) = flxo,2] E f [£o £1] 
> flosna](æ-7) = Elto — tiroz] 


=> f(x) = f[ro] +(x -— xo) f [zo, £1] + (£ — xo) (x — x1) fixo, 21, £] . 


De maneira análoga, de (n+1), obtemos: 


fiz) = AFflxol+(x-— xo) f [£o, £1] + (£ — xo) (x — z1) f [£0, £1, £2] 


(a zo) (a zı) (a x2) f [£0, £1, £2, £3] Eras 
(10.27) 


(t= to) SE) as dE tni) tios a 


{(x — zo) (x — z1) .. . (£ — En) f [£0; £1,- - - , £n, £] }2 - 


Temos assim, obtido uma fórmula de recorrência para f(x). Vejamos o que significam [...h e {..-}2 
em (10.27). 


Teorema 10.6 O polinômio: 
Pa(x) = f [zo] + (x -— xo) flxo, 1] 
+ -..+(£-— zo)... (£ — £n-1) f [£0; 21; --, £n] = {J} 


é o polinômio de interpolação da função y = f(x) sobre os pontos £o, £1,...,£n, isto é, Palzk) = 
f(k), k=0,1,...,n. 
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Prova: ( provaremos por indução em n). Assim: 


i) Para n = 1, temos que: 


Px) f [£o] + (x — xo) fixo,m1] 


J [zo] + (x — mo) f [z1] — F [zo] 


Tı — To 


Logo: 


zo) f [z1] = f [zo] = f[zo], 


para x = zo > P(zo) = f [zo] + (xo EET 


zo) fleı] — fleo] _ f [z] . 


Tı — To 


praz=7 => P (x1) = f [zo] + (zı 


2) Suponhamos válido para n = k — 1, isto é, Pk-1(x:) = f(x;), i= 0,1,...,k— 1. 


3) Provemos para n = k. Divideremos a prova em duas partes. Assim: 


a) Seja i < k ; então: 


P; (xi) = Pp-1(xi) + (xi — zo) (£i — x1)... (£i — £k-1) f [£0, £1,- , £k] 
= Pk-i(zi) = Hui), 
usando a hipótese de indução. 
b) Seja i = k; então: 
Pe (£k) = f[zro]+ (zk — xo) f [xo, x1] rai 


+ (£k — z0) (£k — £1)... (Lk — te) f [£0, £1,- -, £k] 


Fazendo x = xy em (10.27), (lembrando que n = k), e comparando com a expressão obtida acima 
para P(x£k), vemos que Pk(£k) = f(x), o que completa a prova do teorema. 


Teorema 10.7 - Para x €[a,b] £ Æ £k, k=0,...,n, 


a ARE 


f [£0, £1, £2,- , En, £] — (n+1)! ; E E (xo, £n). 
Prova: Usando o Teorema 10.6, em (10,27), podemos escrever: 


f(x) = Pile) + (x—-20)...(x— £n) f [£0, £1, ..., En, £] 
> f(x)— P(x) = (z — zo)... (£ — £n) f [£0, £1,- .-, En, £] (10.28) 


Por outro lado, usando (10.12), temos que: 


re 


Ha) — Pale) = Ralo) = (x — xo) (x — x1)... (2 — zn) ADO 


(10.29) 
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onde é E (xo,%n). 


Mas (x — zo) (x — z1)... (£ — £n) £ 0 , pois os pontos tabelados são distintos, Assim comparando 


(10.28) com (10.29), segue que: 


FDE) 
(n+D! 


E (£0, Tn) š 


flzo,z1,.. Tn 2] = 
Portanto: 
Patr) = f(z0)+ (2 -— x0) f [£0, £1] + (x — zo) (£ — x1) fixo, £1, xa] 
+... + (æ — zo) (®— z1)... (£ — n1) flzozo. Zn] = Loh, 


chama-se Forma de Newton do Polinômio de Interpolação ou Fórmula de Newton, e 
Ralo) = (x — xo) (x — z1)... (£ — Tn) frota. sunt] = Lda, 


chama-se termo do resto ou erro de truncamento. 


Observe que o tratamento do erro de truncamento é, portanto, o mesmo da forma de Lagrange. 


Exemplo 10.9 - Conhecendo-se a seguinte tabela: 


£ | —1 0 3 
fæ) | 15 8 -1 


calcular f(1), usando polinômio de interpolação de Newton. 


Solução: Temos: 


Tto = —1 , fo == f (xo) = 15 , 
Tv = 0, h = f(m)-8, 
t2 = 3, fo = f(t) = —1, 


e portanto n = 2. Assim o polinômio de interpolaçào na forma de Newton é dado por:: 
P(x) = f [xo] + (x — xo) f [xo, x1] + (£ — zo) (x — x1) f [£0, £1, £2] 


Em primeiro lugar, construímos a tabela de diferenças divididas. Assim: 


x f(x) 

-1 15 
-7 

0 8 1 
-3 

3 -1 
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Portanto: P(x)=15+(2+D(-7) + (x+ 1)(x — 0)(1). 
Agrupando os termos semelhantes obtemos: P (x) = x? — 6 x + 8. 


Os valores de f(1) é dado por P2(1), lembrando que este é um valor aproximado. Assim: P>(1) = 


3 = f(1). 


Desde que pelo Teorema 10.1 o polinômio de interpolação é único e como o exemplo acima foi resolvido 
pela fórmula de Lagrange, era de se esperar o resultado obtido. 


Como no caso de Lagrange, existe um esquema prático para calcular o valor do polinômio de inter- 
polação num ponto sem determinar a expressão do polinômio. Assim: 


Esquema Prático 


Tomemos para exemplo o polinômio de interpolação de Newton de grau 3. Assim: 


P(x) = Fflrol+(x-—sxo)flzo,m] + (x— xo) (x — z1) f [£0, £1, £2] + 


+ (z -— zro)(z-— z1) (x — xo) flxo, £1, £223]. 


= f[ro] +(x- zo) {f [x£o, x1] + (x — x1) {f [x£0, £1, £2] + (x — x2) fixo, £1, £2, £3]}} - 


Observe que a idéia do esquema prático é ir colocando os termos comuns, que aparecem de uma 
determinada parcela em diante, em evidência. Denominando: 


f [£0, £1, £2, £3] = ao 


£0, £1, £2,] + (£ — z£2)ao = qq 


f 
f [£0; £1] + (x — z1)aı = a» 
f 


zo] ee (x — zo) a = Q3 — P(x) . 


O esquema prático é então dado por: 


flxo, £1, £2, £3] flxo, xr, x2] flxo, 1] flxo] 
| Ed + | zar] 
&o 2 q q o > as = P(x) 
x v x 
£ — T2 £— Tı £ — To 


Assim para um polinômio de grau n teremos a, = Pa (£) = f(x). 
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Exemplo 10.10 - Aplicar o esquema acima ao exemplo anterior, isto é, calcular f(1). 


Solução: Temos: 


f (xo) = 15, £o = -1, 
f [£o0, x1] T zo tı = 0, 
f [£0, £1, £2] = 1 $ T2 = 3 . 
Montamos o esquema: 
1 -7 15 
| + | + | 
1 e -6 | 3=P2(1) 
a E 
1 2 
Assim P(D)=3= f(1). 
Observação: Como a diferença dividida f[z£o, £1, ..., £n, £] não depende da ordem de seus argumen- 
tos, podemos reescrever os pontos £o, %1,...,%Yn, em ordem crescente £9, T1,- - -Lh Thp1 Então pelo 
Teorema 10.7, temos: 
FETE) 
f EE EE E == (n + 1)! ; É (£0, 2h41) a (10.30) 


Este resultado nos permite avaliar o comportamento da derivada de ordem n + 1 de uma função 
y = f(x) (supondo que ela existe), por meio das diferenças divididas de ordem n + 1 dessa função no 
intervalo [a,b]. 


Em particular, a diferença dividida de ordem n de um polinômio P (£) = ang” + ani i +... + 
as + ao é independente do ponto x e igual a a, (coeficiente de seu termo de grau n). As diferenças de 
ordem maior que n são todas iguais a zero. Assim, ao examinarmos uma tabela de diferenças divididas 
de uma função, se as diferenças de ordem k são praticamente constantes, isto significa que a função 
é bastante próxima de um polinômio de grau k. Podemos, então, usar um polinômio de grau k para 
interpolar tal função. 


Exemplo 10.11 - Dada a tabela: 


da Be ME Sã 6d 
f(x) | 0.13 0.19 0.27 0.38 0.51 0.67 


determinar: 
a) o polinômio de interpolação de grau adequado, 


b) calcular f(4.5), 
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c) dar uma estimativa para o erro de truncamento. 


Solução: Inicialmente construímos a tabela de diferenças divididas. Assim: 


zi | f(z) fimo] 

2 0.13 
0.06 

3 0.19 0.01 
0.08 

4 0.27 0.015 
0.11 

5 0.38 0.01 
0.13 

6 0.51 0.015 
0.16 

T 0.67 


a) Como as diferenças divididas de 2ə ordem são praticamente constantes podemos adotar um polinômio 
de 2º grau para interpolá-la. Além disso, como queremos avaliar f(4.5), escolhemos 3 pontos na 
vizinhança de 4.5. Seja então: x9=4, xı =5 e x) =6. Assim: 


Po(x) fizo) + (x — xo) f [£o, x1] + (x — xo) (x — x1) f [£0, £1, £2] 
= 0274 (2- 4011) + (2 - 4) (2 — 50.01) 
= 0.01 z? + 0.024 + 0.03. 


b) Agora, f(4.5) = P5(4.5) = 0.01 (4.5)2 + 0.02 (4.5) + 0.03 = 0.3225. 


c) Para dar uma estimativa para o erro de truncamento calculamos as diferenças divididas de ordem 3 
para a função dada. Fazendo os cálculos observamos que elas são em módulo iguais a 0.005. Assim, 


usando (10.30), segue que: 


IRo(4.5)] < (45 -= 4) (45 - 5) (45 - O) [SI 


Portanto: Rs(4.5) = 0.000625 = 6 x 1074. Logo podemos dizer que o resultado acima, obtido para 
f(4.5), possui 3 casas decimais corretas. 


Exercícios 


10.18 - Seja a função tabelada: 


x |-2-1 12 
Ha) | 0 10 


a) Determinar o polinômio de interpolação de Newton. 


b) Calcular f(0.5). 
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10.19 - Dada a função tabelada: 


s |0 1 15 25 30 
fa) [10 0.5 04 0.286 0.25 


a) Determinar o polinômio de interpolação de Newton sobre 2 pontos (interpolação linear). 
a) Determinar o polinômio de interpolação de Newton sobre 3 pontos (interpolação quadrática). 


b) Calcular f(0.5), usando o item a) e o item b). 


Lembre-se que o polinômio de Newton sobre 3 pontos é igual ao polinômio sobre 2 pontos adicionado 
ao termo de ordem 2. Além disso, o ponto zo deve ser comum aos 2 polinômios. Portanto tome cuidado 
ao escolher os pontos. 


10.20 - Considerando a função f(x) = yx tabelada: 


z | 1.00 1.10 1.15 1.25 1.30 
f(x) | 1.000 1.048 1.072 1.118 1.140 


a) Determinar o valor aproximado de v1.12 usando polinômio de interpolação de Newton sobre 
3 pontos. 


b) Calcular um limitante superior para o erro. 


10.21 - Sabendo-se que a equação 1º +612-1 = O tem uma raiz em [0,1], determinar o valor aproximado 
dessa raiz usando polinômio de interpolação de Newton sobre 3 pontos. 


10.22 - Dada a tabela: 


g |1 1.01 1.02 1.03 1.04 1.05 
vz [1 1.005 1.01 1.0149 1.0198 1.0247 


a) Calcular 1.035 por meio de um polinômio de interpolação de grau adequado. 


b) Dar uma estimativa para o erro de truncamento. 


10.7.5 Diferenças Ordinárias 


Do mesmo modo que no caso de Lagrange, existe uma fórmula mais simples para o polinômio de 
interpolação quando os argumentos x; são igualmente espaçados. Consideremos então a construção do 
polinômio de interpolação quando os argumentos x; são igualmente espaçados de, digamos, h 0. 


Para tanto, precisamos da noção de diferença ordinária de uma função. Assim: 


Definição 10.3 - Sejam zo, %1,..., Zn; N+1 pontos distintos em [a,b] tais que xy — x; = h,i = 
0,1,...,n— 1 e sejam fo, fi,..., fnn + 1 valores de uma função y = f(x) sobre x = zk, k=0,...,n. 
Define-se: 
APF (£k) = fan), 
(10.31) 
A" (zp) = ATtf(an+h) — Af (2) , 


onde A" f (xx) é a diferença ordinária de f(x) de ordem r em z = tp. 
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Assim, usando a definição, temos: 
APF (zk) = fla), 
Af (zk) = Aºf(ap+h) — AS (er) = f(k +h) — f(x), 


A?f (xk) = AŽf (ak +h) — Atf (2k) 


= AÌ f (£k + 2h) — A? f (zk +h) — AO (zk +h) + AP Ff (xx) 


= f(xu+2h) — 2 f(x +h) + f(x), 


ASF (ak) = flek t+3h) — 3f (zr +2h) + 3f (zk+h) — f(x), 


ape = (o) etm = (1 ) te- 


Portanto: 


Entretanto, podemos calcular as diferenças ordinárias de um função, de uma maneira mais simples, 
através do 
10.7.6 Cálculo Sistemático das Diferenças Ordinárias 


Para calcular as diferenças ordinárias de uma função f(x) sobre os pontos £o, £1, ..., £n, (igualmente 
espaçados de h), construímos a 
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Tabela das Diferenças Ordinárias 


x f(x) A! A? 


to | AP f(xo) = fo 
A! f (xo) = Aºf (z1) — A? f (xo) 
zı | Af (z1) = fı A? f (z0) = A? f (x1) — A' f (xo) 
Af (x2) — A’ f (£0) = A’ f (21) 
z2 | A? F (x2) = fo A? f (z1) = A? f (x2) — A? f (21) 
A' f (x2) = A’ f (z3) — A f (z2) 


z3 | Aºf (£3) = f3 A? f (x2) = A! f (z3) = Atf (x2) 
Alf (x3) = AP f (x4) — AP f (x3) 


ga: | APF (z4) = fa 


da seguinte maneira: 


a) a primeira coluna é constituída dos pontos x;, i = 0,1,...,n; 

b) a segunda coluna contém os valoress de f(x) nos pontos x;, i = 0,1,2,...,n; 

c) nas colunas 3,4,5, ..., estão as diferenças ordinárias de ordem 1,2,3,.... Cada uma dessas diferenças 
é simplesmente a diferença entre duas diferenças ordinárias consecutivas e de ordem imediatamente 


inferior. 


Exemplo 10.12 - Para a seguinte função tabelada: 


|-2 -1 0 1 2 
fw)|-2 29 30 31 62 


construir a tabela de diferenças ordinárias. 


Solução: Usando o esquema acima temos que: 
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tr | Alf (a) Atf (xp) A? Ff (xp) A? f (ap) AF (£) 
-2 -2 
29 — (—2) = 31 
-1 29 1 — (—31) = —30 
30-29=1 0 — (=30) = 30 
of 30 iisi 30-30=0 
31-30=1 31-1=30 
1 31 31 — 1 = 30 
62 — 31 = 31 
2 62 


Assim, o elemento 0, corresponde à diferença ordinária A? f (xı). Portanto usando a definição, se- 
gue que: A? f (x1) = Atf (£x2)—A1f (x1) e usando o item c) acima, temos que: A? f (xı) = 1-1 = 0. 


Observação: Como veremos adiante, os resultados a serem utilizados na construção do polinômio de 
interpolação, para argumentos igualmente espaçados de h, são os primeiros valores em cada coluna de di- 
ferenças embora tenhamos que construir toda a tabela pois, novamente, os valores não são independentes 


uns dos outros. 


A relação entre as diferenças divididas de ordem n de uma função e as diferenças ordinárias de f(x) 
de ordem n num ponto xo é dada pelo seguinte: 


Teorema 10.8 Sex, = zo + kh ; k=0,1,. 


Postiga 


“sn, então 


SEn] = 


Prova: (provaremos por indução em n). Assim: 


1) para n = 1. Temos por definição, que: 


f (21) — f(xo) 


flzo;m1] = 


h” en! 


_ f(zto+h)-— f (zo) 


A” f (20) 


At (xo) 


Tı — To 


h 


desde que xı = £o + h , f(x1) = AP f (z1) e f(xo) = A? f (z0). 


2) Suponhamos válido para n = k — 1. 
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3) Provemos para n = k . Usando a definição e a seguir a hipótese de indução, obtemos: 


Li,TD,...,L% = ES TO? DS Er a Rap RR ba é 
fixo, £1,- -., £k] = fl 1,42, , ae go, 1, stk 1] 


1 PES de (z1) A*— f (zo) 
Eh |h kD a kiN 


= meg [A (zo +h) — A+- f (zo)] 


AF f (xo) 


hë- k! 


Observe que as diferenças ordinárias de ordem n de um polinômio de grau n, P (£) = aqu" 1 +...+ 
ax + aq são iguais a n! h” - an. As diferenças ordinárias de ordem maior que n são todas nulas. 


10.7.7 Fórmula de Newton-Gregory 


Assim, usando o Teorema 10.8 no Teorema 10.6, obtemos que o polinômio de interpolação na forma 
de Newton, para uma função y = f(x) no intervalo [x9, £n] pode ser escrito, no caso de argumentos x; 
igualmente espaçados de h, da seguinte maneira: 


Atf (xo) A? f (xo) 
h 


Plx) = f(xo)+ (£ -— xo) 
(10.32) 


Esta forma do polinômio de interpolação é conhecida como fórmula de Newton-Gregory. 


Exemplo 10.13 - Dada a função tabelada: 


fæ) | 


determinar o polinômio de interpolação de Newton- Gregory. 


Solução: Temos: 


to = —1 ; f (xo) == 3 , 
tı = 0 , f (z1) = l , 
t2 = 1, f (22) = —1, 


Ta = o 2 f(xs) = 0, eportanton=3. 
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Assim, devemos construir o polinômio: 


A A? 
Pio) = f (20) + (æ - ro) SHE 4 (æ — zo) (a — 0) AF 4 
A3 
+ (z -— zro)(x -— zı) (x — xo) f (z0) : 
h? - 3! 
Construímos inicialmente a tabela de diferenças ordinárias. Assim: 
x | f(x) 
-1| 3 
-2 
0/1 0 
-2 3 
1/41 3 
1 
21 0 
Logo: 
- E | (0), spaan 
P(x) = 3+(xz+1)(—2)+ (x+ Dx —0) z (x+ 1)(x-— 0)(x — 1) E 
3 1 
= 3—2r—2+ (xr? -— zx) 5 
z3 5 
P. =D — 5 ; 
Exercícios 
10.23 - Considere a função y = f(x) dada pela tabela: 
z | 4 0 1 2 
fx) | -2 0 2 4 
Determinar o polinômio de interpolação usando: 
a) forma de Newton. 
b) forma de Newton-Gregory. 
10.24 - Dada a função y = sen x tabelada: 
x | 1.2 1.3 1.4 1.5 


sen q | 0.952 0.964 0.985 0.997 
a) Calcular o polinômio de interpolação de Newton. 


b) Calcular o polinômio de interpolação de Newton-Gregory. 
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c) Calcular sen 1.35. 
d) Dar um limitante superior para o erro. 
10.25 - Dada a tabela: 


0 | 1 
Dé 5 cb 


Calcular a,b e y, sabendo-se que ela corresponde a um polinômio do Sºgrau. 
Sugestão: Construa a tabela de diferenças ordinárias. 


10.26 - Dada a tabela: 


z | -2 -1 0 1 
o) 15 0 1 0 


Calcular f(0.5) usando polinômio de interpolação sobre todos os pontos. 


10.8 Exercícios Complementares 


10.27 - Considere a função f(x) dada pela tabela: 


1 2 3 
0 0 0 


z | 

Ha) | 

e o polinômio dado por: P(x) = a(a — 1)(x — 2)(x — 3). 
) 


0 
0 


z 
a) Verifique que: P(x,) = f(£k), k = 0,1,2,3. 
b) P(x) é o polinômio interpolador da f(x) sobre os pontos 0, 1, 2 e 3? Justifique. 


10.28 - Quando conhecemos os valores de uma função y(x) e de sua derivada y'(x) em pontos dados, 
isto é, dados: 


(£0, Yo), (£1,Y1),---, (En; Yn) 


(£0, Yo), (21, Y1); -- -> (En: Yn) , 


podemos montar um único polinômio Poryi(x) de grau < 2n + 1 tal que 
Ponte) = yi Pangilti) =Y DSO, Lat 
Sabendo que : 


(£0, yo) Z (0,0), (x1,y1) = (1,1), 


(z0, Y0) = (0,1), (21,41) = (1,0) , 


determine Ps(x) e Pi(a) tal que: 
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10.29 - Mostre que a interpolação de um polinômio de grau n por n+k pontos, k > 1, é exata. 


10.30 - 4 raiz de uma função pode ser aproximada pela raiz do seu polinômio de interpolação. Use 
uma parábola para determinar a raiz da função tabelada a seguir, 


x [a 2 3 4 5 6 
f(x) | 0.841 0.909 0.141  —0.757 —959 —0.279 


10.31 - Use uma parábola para determinar uma aproximação para a única raiz positiva da equação 
4 cosx — e” = 0. 


10.32 - Se f(x) é um polinômio de grau 5, que característica especial tem uma tabela de diferenças 
divididas desse polinômio sobre 10 pontos? 


10.33 - Frequentemente acontece que valores tabelados de uma variável y dependente de uma variável 
x são dados, e pretendemos achar o valor de © da variável independente correspondente a um dado y da 
variável dependente. Isto é conhecido como interpolação inversa. 4 partir da tabela: 


x | 05 0.7 1.0 1.2 15 16 
f(x) | -263 -257 -200 -123 063 0.79 


determinar a raiz de f(x) usando interpolação inversa sobre 3 pontos. 


10.34 - Sabe-se que f(x) = 5x3 — 3x? + 2x — 2 tem um zero no intervalo [0,1]. Usando interpolação 
inversa sobre uma tabela de 3 pontos, determinar aproximadamente Z correspondente a f(x) = 0. 


10.35 - Uma maneira de se calcular o valor da derivada de uma função em um ponto xo, quando não 
se conhece a expressão analítica da mesma, é usar uma tabela para formar um polinômio que aproxime a 
função, derivar então esse polinômio e avaliar sua derivada em x = xo. Dada a tabela: 


x | 0.35 0.40 0.45 0.50 0.55 0.60 0.65 
f(x) | —1.52 1.51 149 1.47 1.44 142 1.39 


calcule um valor aproximado para f'(0.50) usando polinômio de interpolação de grau 2. 


10.36 - Deseja-se obter e” cosx, para x € [0,1.2], com duas casa decimais corretas, através de inter- 
polação linear usando uma tabela para argumentos x; igualmente espaçados de h. Quantos valores deve 
ter essa tabela? 


10.37 - A função distribuição acumulada é definida por: 


1 £ 
V 2T 


Para 0 < x < 1 as derivadas de f(x) são limitadas como segue: 


Ho = [ did 


0< f'(a)<04, 
0< f(2)<05, 
044 f”(x)<1.2. 


Se f(x) é dada com 4 casas decimais para x = 0, 0.1, ..., 0.9, 1.0, qual o grau mínimo que deve ter 
um polinômio interpolador se queremos 4 casas decimais precisas na aproximação de f(x) paraO < x < 1? 
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5 


10.38 - Com que grau de precisão podemos calcular e! usando interpolação sobre os pontos: xo = 


10, zı = 20, z2 = 30 ? 


10.39 - Com quantas casas decimais precisas podemos calcular cosh 0.68 usando interpolação linear na 
tabela: 


z | 0.30 0.40 0.50 0.60 0.70 
cosh a | 1.0453 1.0811 1.1276 1.1855 1.2552 
Lembre-se que : cosh z = Ee, 
10.40 - Dada a tabela: 
$ | 0.1 0.2 0.3 0.4 0.5 
Ina | —2.303  —1.609  —1.204  —0.916  —0.693 


a) Estimar In(0.32) através de interpolação linear e quadrática. 


b) Qual deve ser o valor de h, se queremos obter Inx, com 3 casas decimais corretas, para x > 1, 
através de interpolação linear usando uma tabela para argumentos x; igualmente espaçados de h ? 


10.41 - Considere as seguintes tabelas para uma mesma função: 


=? | 0 11 26 34 45 
fo) |-1 10 B 5 A 


z | 0 11 26 34 45 58 
fæ) | -1 10 13 15 24 34 


a) Deseja-se obter o polinômio interpolador para a tabela i) e depois para a tabela ii), de modo 
a fazer o menor número de operações. Qual o método ideal? Justifique. 


b) Calcule os polinômios interpoladores para as tabelas i) e ii) usando o método escolhido no 
item a). 


10.42 - Suspeita -se que a tabela: 


T | —3.0 —2.0 —1.0 00 10 2.0 
y | —9.0 0.0 1.0 0.0 3.0 16.0 


representa um polinômio cúbico. Como testar esse fato? Explique. 
10.43 - Considere os pontos igualmente espaçados: 
£o, £1, T2, L3, T4; £k = To + kh, k=0,1,...,4, 
e as diferenças divididas de 1º ordem de uma função f(x), sobre esses pontos, dadas por: 


fixo,m] = 8, flzı, x2] = 8 + 2h, 


flz2,£3] = 6+4h, frz, x4] =8+6h; 680. 


Qual é o grau do polinômio interpolador ? Por que? 
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10.44 - Seja f(x,y) uma função definida sobre os pares (x,y), com 
Ti S TL Ziyi; Yj SYL Yj+ o 


onde frs = f(£r, Ys). 


fisj+ B fi+1,j+1 
Yj+1 
(x,y) 
y 
fij fia, 
Yj 
Ti x Xi+1 


A função f(x,y) pode ser aproximada da seguinte maneira: 


“Primeiro faz-se a interpolação linear através de fij e fis1, obtendo-se a aproximação fa e em se- 
guida, através de fi j+1 e fi+1,j+1, obtendo-se a aproximação fp. Então interpola-se linearmente através 
de fa e fg para obter a aproximação final f(x,y).” 


a) Seja: 

X— Li y == Yj 
Q&Q = ————; epe 
Ti+1 — Ti Yj+1 7 Yj 


Mostre que a fórmula resultante do processo acima é dada por: 


fay) = Jd - b) fij t a Bias 


+ Sobra Fobia 


b) Considere a tabela para f(x,y): 


x | 75 100 125 150 
y 
42.5 89 90 91 93 
65.0 12 78 82 87 
81.5 54 68 12 79 
100.0 35 55 64 70 
120.5 13 45 51 61 


Obtenha aproximação para f(110, 98). 
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10.9 Problemas Aplicados e Projetos 
10.1 - O gráfico de uma função f é quase um segmento de parábola atingindo seu extremo valor em um 
intervalo (zo, 12). Os valores funcionais fi = f(x;), são conhecidos em abcissas equidistantes xo, £1, £2. 


O valor extremo é procurado. 


a) Use interpolação quadrática para obter a coordenada x do extremo. 


b) Os comprimentos dos dias em Lulea, na Suécia são dados por: 


Idejunho : 20h 56min 
16dejunho : 22h 24min 
Idejulho : 22h Olmin 
I6dejulho : 20h 44min 


Use o resultado da parte a) para determinar qual é o dia mais longo em Lulea e qual é sua duração. 


c) Estime o erro cometido em b). 


10.2 - Um projétil foi lançado de um ponto tomado como origem e fez-se as seguintes observações: 


VA 
6+ EN 
N 
ÀN 
4t 
2 + 
+ >— 
20 k 


isto é: 


i) fotografou-se o projétil a 10 metros do ponto de lançamento e foi determinado sua altitude 
no local: 6 metros. 


ii) uma barreira a 20 metros do ponto de lançamento interceptou-o e aí foi determinada sua 
altitude: 4 metros. 
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Com esses 3 pontos é possível interpolar a trajetória do projétil. Comparando a equação teórica da 
trajetória com a obtida pela interpolação é possível determinar os parâmetros de lançamento: o ângulo 
W% com a horizontal, e a velocidade inicial vo. Assim: 


a) Determine o polinômio interpolador. 


b) Determine y% e vo sabendo que a equação da trajetória é dada por: 


x? 


tg Y% l 
= gT — — Ds 
i E 2º vê cos? y’ 
onde g = 9.86m/s2. 

c) Calcule a altitude do projétil a 5 metros do ponto de lançamento. 


10.3 - Na tabela a seguir está assinalado o posicionamento de um ônibus, partindo do marco zero de 
uma rodovia federal, 


tempo(min) | 60 80 100 120 140 160 180 
posição (Km) | 76 95 112 138 151 170 192 


Pede - se os possíveis posicionamentos do ônibus para os tempos de 95 min., 190 min. e 170 min. 
Use reta e parábola. 


10.4 - Um paraquedista realizou seis saltos, saltando de alturas distintas em cada salto. Foi testada a 
precisão de seus saltos em relação a um alvo de raio de 5 metros de acordo com a altura. A distância 
apresentada na tabela a seguir é relativa à circunferência. 


Altura(m) Dist. do alvo(m) 
1° salto 1500 35 
2º salto 1250 25 
3º salto 1000 15 
4º salto 750 10 
5º salto 500 7 


Levando em consideração os dados acima, a que provável distância do alvo cairia o paraquedista se 
ele saltasse de uma altura de 850 metros? Use reta e parábola. 


10.5 - Os resultados da densidade da água p em várias temperaturas estão contidos na tabela a seguir: 


T | 0 5 10 15 20 25 30 35 40 
p | 0.9999 0.9998 0.9997 0.9991 0.9982 0.9971 0.9957 0.9941 0.9902 


Calcular : 
a) p(13), 
b) p(27), 


usando parábolas de 2° e 3° graus. 


10.6 - Conhecendo-se o diâmetro e a resistividade de um fio cilíndrico verificou-se a resistência do fio 
de acordo com o comprimento. Os dados obtidos estão indicados a seguir: 


Comp.(m) | 500 1000 1500 2000 2500 3000 3500 4000 
Res.(Ohms) | 2.74 5.48 7.90 11.00 13.93 16.43 20.24 23.52 


Determine quais serão as prováveis resistências deste fio para comprimentos de: 
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a) 1730 m, 
b) 3200 m, 
usando parábolas de 2° e 3° graus. 


10.7 - Sendo 200 candelas a intensidade de uma lâmpada, foi calculada a iluminação em casos de 
incidência normal, sobre uma superfície situada a distâncias conhecidas, quando para cada distância foi 
calculada a iluminação, conforme a tabela: 


Dist.(metros) | 1.00 1.25 1.50 1.75 2.00 2.25 2.50 
Ilum.(lux) | 200.00 128.00 88.39 65.30 50.00 39.50 32.00 


Calcular a iluminação, quando a superfície estiver situada a: 
a) 1.60 m da lâmpada, 
b) 2.38 m da lâmpada, 
usando parábolas de 2º e 3º graus. 


10.8 - Um veículo de fabricação nacional, após vários testes, apresentou os resultados a seguir, quando 
analisou-se o consumo de combustível de acordo com a velocidade média imposta ao veículo. Os testes 
foram realizados em rodovia em operação normal de tráfego, numa distácia de 72Km. 


Veloc.(Km/h) | 55 70 85 100 115 130 
Cons(Km/) | 1408 13.56 13.28 1227 1130 10.40 


Verificar o consumo aproximado para o caso de serem desenvolvidas as velocidades de: 
a) 80 km/h, 
b) 105 Km/h, 


usando parábolas de 2º e 3º graus. 


10.9 - A lei de Ohm diz que: 
E = RI, 


onde E é a voltagem, I é a corrente e R a resistência, isto é, o gráfico de E x I é uma reta de coeficiente 
angular R que passa pela origem. Vários tipos de resistores, entretanto, não possuem essa propriedade 
linear. Tal resistor é chamado de um resistor não linear, ou um VARISTOR. Muitos tubos de vácuo são 
varistores. Geralmente, a relação entre a corrente e a voltagem para um varistor pode ser aproximada 
por um polinômio da forma: 


I = E+E? +... +a E” = 5 aF’ + P(E). 
1=1 


Considere agora um circuito consistindo de um resistor linear Rı e um varistor Ro, como na figura a 
seguir: 


Ri Ro 
VAVÁ VA VAVÁ VA 
Er — E2 
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As equações para o circuito são: 


E, 2 
L = = = aiEs ; 
E = ki +E, 


e portanto, 


Ri (Sen) +E = E ou Rı Pa (E2) + Es = 


i=l 


Suponha que num certo experimento, os seguintes dados foram obtidos: 


Es(Volts) [0.0 0.5 1.0 1.5 20 25 30 35 40 4.5 
I(Ampéres | 0.0 0.0125 0.06 0.195 0.5 1.0875 2.1 3.71 6.12 9.5625 


a) Calcule a voltagem total E e a voltagem E, quando E, = 2.3 Volts e Rı = 10 Ohms, usando 
polinômio de interpolação sobre todos os pontos. 


b) Use interpolação inversa de grau 2 para calcular a tensão no varistor quando E, = 10 Volts e 


Ri = 100hms. 


10.10 - Um foguete é lançado na direção mostrada na figura: 


a” 


e as coordenadas x e y nos vários instantes de tempo t após o lançamento, estão dados na tabela: 


t Hm y 
(segundos) ( mil pés) (mil pés) 
0 0 0 
100 80 300 
200 200 700 
300 380 1200 
400 500 1000 
500 550 600 
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a) Calcule x(250), y(250) e y(x(250)), usando polinômio de interpolação sobre todos os pontos. 


b) Compare os valores de y(250) e y(x(250)). Os resultados são os mesmos? Deveriam ser? 


Observe que se você estiver fazendo um programa para resolver este problema, no item a) você deverá 
interpolar (ti, £i), (ti, yi) e (£i, Yi), ou seja, existirá três polinômios interpoladores e apenas uma subrotina. 


10.11 - A constante de equilíbrio para amônia reagindo com gases de hidrogênio e nitrogênio depende 
da proporção molar de hidrogênio - nitrogênio, da pressão e da temperatura. Para uma proporção molar 
de hidrogênio - nitrogênio 3 para 1 a constante de equilíbrio para uma faixa de pressões e temperaturas é 
dada por: 


Pres. | 100 200 300 400 
Temp. 
400 0.0141 0.0159 0.0181 0.0207 
450 0.0072 0.0080 0.0089 0.0103 
500 0.0040 0.0044 0.0049 0.005% 
550 0.0024 0.0026 0.0028 0.0031 


Determinar a constante de equilíbrio para: 
a) 462º Ce uma pressão de 217 atm, 
b) 523º Ce uma pressão de 338 atm. 


usando interpolação linear. 


Observe que vale a mesma observação do problema anterior, ou seja, para cada item existirá três 
polinômios interpoladores e apenas uma subrotina . 


10.12 - A tabela a seguir relaciona a quantidade ideal de calorias em função da idade e do peso, para 
homens que possuem atividade física moderada e vivem a uma temperatura ambiente de 20º C. 


idade | 25 45 65 
peso 
50 2500 2350 1900 
60 2850 2700 2250 
70 3200 3000 2150 
80 3550 3350 2850 


Usando interpolação linear, determinar a cota aproximada de calorias para um homem 
a) de 35 anos que pesa 62 quilos, 
b de 50 anos que pesa 78 quilos. 


Vale a mesma observação do problema anterior. 


Capítulo 11 


Integração Numérica 


11.1 Introdução 


Integrar numericamente uma função y = f(x) num dado intervalo [a,b| é integrar um polinômio 
Pala) que aproxime f(x) no dado intervalo. 


Em particular, se y = f(x) for dada por uma tabela ou, o que é o mesmo, por um conjunto de pares 
ordenados (xo, f(x0)), (£1, f(x1)),..., (£n, f(£n)) (onde os x; podem ser supostos em ordem crescente), 
zo = 4, £n = b, podemos usar como polinômio de aproximação para a função y = f(x) no intervalo [a, b] 
o seu polinômio de interpolação. 


Em particular, o polinômio de interpolação para a função y = f(x) no intervalo [a,b], a = £o, b = £n 
é um polinômio de aproximação para f(x) em qualquer sub-intervalo [x;, xj], 0 < i < n,0 < j < n do in- 
tervalo |a, b]. Podemos então usar o polinômio P„(x) para integrar f(x) em qualquer desses sub-intervalos. 


As vantagens de se integrar um polinômio que aproxima y = f(x) ao invés de f(x) são principalmente 
as seguintes: 


a) f(x) pode ser uma função de difícil integração ou de integração praticamente impossível, por 


exemplo, 
r s 
SO ass do 
o f= s$) 


enquanto que um polinômio é sempre de integração imediata. 
b) se conhece a solução analítica do resultado da integral, mas seu cálculo só pode ser obtido aproxi- 
madamente, por exemplo: 


4 dt 1 I yraa 
0 


— = — lo 
14 W2 I -aV 


arc tg + arctg 


1 x x 
2/2 v2-a v2+2 


321 
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c) a função é dada simplesmente através de uma tabela-conjunto de pares ordenados obtidos como 
resultados de experiências. Aí não se conhece a expressão analítica da função em termos do argu- 
mentos x. 


As fórmulas de integração são de manejo fácil e prático e nos permite, quando a função f(x) é conhe- 
cida, ter uma idéia do erro cometido na integração numérica, como veremos mais adiante. 


Consideraremos integrais da forma: ; 
f e, 
a 
onde w(x) > 0 e contínua em fa, b]. 
A função w(x) é chamada função peso e é igual a zero somente num número finito de pontos. 
Usaremos Fórmulas de Quadratura para aproximar a integral. 


Fórmulas de quadratura são aquelas que aproximam a integral usando combinação linear dos valores 
da função, isto é: 


b n 
I w(x) f(x)dx ~ > Antas) 
e k=0 


Seja R(f) o erro, isto é: 


b n 
RA) = f alo)fado -YA (2) + 
a k=0 


Definição 11.1 - O grau de precisão de uma fórmula de quadratura é por definição o maior inteiro 
m tal que R (x) =0, k=0,1,...,m e R(z®t) #0. 


Observe que isto é equivalente a dizer que a fórmula de quadratura tem grau de precisão m se é exata 
para todo polinômio de grau < m e é não exata para polinômios de grau m + 1. 


11.2 Fórmulas de quadratura interpolatória 


Sejam x0,%1,...,%n, Nn + 1 pontos distintos em [a,b] e sejam fo, fi, ---, fn, n+ 1 valores de uma 
função y = f(x) sobre £o, £1,..., En- 


Seja P(x) o polinômio de interpolação da função y = f(x) sobre os n + 1 pontos. Pela fórmula de 
Lagrange, (Capítulo 10), temos que: 


Pals) = 5. fetela) . 
k=0 
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Agora, sabemos que: f(x) = Pax) e 


erro na interpolação. 
Portanto, integrando a igualdade anterior de a até b, com função peso w(x), segue que: 
b b b 
f w(a)f(a) de = / w(a)Pa(x) dae + ) w(x)Rn(x) dz 


——— 
R(f) 


I 


b n 
/ w(x) > felelt) dæ + R(S), 
a k=0 


onde R(f) é o erro na integração. 


Logo: 
b n b 
f w(x) f(x) de = Ea w(zlg(£) de + R(f), (11.1) 
j k=0 ê 
ou: g E 
f coto)ta) do = 5) Ah, (112) 
a k=0 
onde: 


b 
Ak = I w(x lp(x) da. 


Portanto (11.2) é uma fórmula de quadratura interpolatória e 


b 
R(f) =f w(x)Rn (x) de, 


é o resto. 


Teorema 11.1 - A fórmula de quadratura é interpolatória se e somente se o grau de precisão é 
pelo menos n. (ou seja, se e somente se a fórmula é exata para todo polinômio de grau < n). 


Prova: A prova deste teorema pode ser encontrada, por exemplo, em [Krilov, 1962]. 


Esse teorema garante que: dados n + 1 pontos distintos, £o, £1,..., Zn, Se exigirmos que a fórmula 
seja exata para todo polinômio de grau < n então os coeficientes A, são determinados completamente. 
Isto é equivalente a dizer que a equação: 


b n 
/ w(x) zê dz = 5 Akti, , 
á k=0 


é satisfeita para i= 0,1,...,n e é não satisfeita para i = n + 1. 
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Exemplo 11.1 - Seja [a,b) = [0,2] e sejam zo = 0, £1 = 1, e z2 = A 
a) Determinar fórmula de quadratura que seja exata para todo polinômio de grau < 2. 


b) Usando a fórmula obtida em a) calcular: 


T (x? — 2) dz . 


Solução: Dado os pontos £o, £1, £2 exigimos que a fórmula seja exata para f(x) = 1; f(x) =x; f(x) = 
x?. Consideremos, por simplicidade, mas sem perda de generalidade, w(x) = 1. Portanto: 


2 
fa = Ao +A +A = 2, 
0 


2 
3 
f rds = 40+ AI + AS, 
0 2 
2 
9 8 
2 
ae am PST RATED SAS RE ae a 
A xde 0:0 1 2'7 3º 
onde os valores: 2, 2, > são o resultado da integral de 0 a 2 de 1, x, «2, respectivamente. Assim, temos 


obtido um sistema linear de 3 equações a 3 incógnitas. Resolvendo o sistema resultante, obtemos: 
A=9;4=8; 4=8. 


Portanto, temos uma fórmula para integrar uma função f(x), no intervalo [0,2], isto é: 


| tade = Stoa) + 37e) + fem). 


que é uma fórmula de quadratura interpolatória. 
b) Temos que: f(x)=272-2,70=0, mx =1, t2= 5. Assim: 


fe)=-2, Ha)=-1, Hed=7 


Portanto, usando a fórmula obtida no item a), temos que: 


[8 -Dar= 5 2) 4 T 1) 4 5 (5) - = z 


e resolvendo a integral, via cálculo, obtemos: 


2 3 2.8 4 
Eds da) =2-4=-2, 
[te Ji= 22 =; o 


Observe que podemos obter uma fórmula de quadratura, usando o método descrito acima. Entretanto, 
obter fórmulas assim é um tanto trabalhoso, pois se mudarmos os limites de integração e ( ou ) os pontos, 
todos os cálculos devem ser refeitos. Seria interessante obtermos fórmulas que não dependessem nem dos 
pontos nem dos limites de integração. Esse objetivo será alcançado com as 
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11.2.1 Fórmulas de Newton-Cotes 


Estudaremos aqui Fórmulas de Newton-Cotes do tipo fechado. Tais fórmulas são aquelas em 
que a e b são pontos da fórmula de quadratura, isto é: a = xy e b = £p; os argumentos x, são igualmente 
espaçados de uma quantidade fixa h, isto é, £k+1 — £k = h, k = 0,1,...,n — 1, a função peso, w(x), é 
constante e igual a 1, e o intervalo de integração é finito. 


Seja y = f(x) uma função cujos valores f(xo, f(x1),..., f(xn) são conhecidos (por exemplo, por meio 
de uma tabela). De (11.2), temos que: 


Tn 


1 f(x) de = f f(x) de S Da | bla) de. 


0 


£ — To 


Supondo então os argumentos x; igualmente espaçados de h e considerando u = ; temos que: 


dx = h du e quando z= zo > u=0, 
T=Tn > U=N. 


Logo: 
MeS hk] aii 


onde os Ay são os polinômios usados na fórmula de Lagrange para argumentos igualmente espaçados. 
Fazendo: 


L àp(u) du = Cr: (11.3) 


obtemos: 
J fæ) de S X` frh OR. (11.4) 
zo k=0 


Observe que a fórmula (11.4) independe dos limites de integração. Trataremos de obter, agora, algu- 
mas fórmulas de Newton-Cotes. Mais adiante analisaremos o termo do resto. 


le Caso: Consideremos n = 1; isto é, queremos obter uma fórmula para integrar f(x) entre dois 
pontos consecutivos £o e xı, usando polinômio do primeiro grau. Temos, em vista de (11.4), que: 


f f(æ)jdæ = 3 fr h C}; (11.5) 


o k=0 
onde, de (11.3), 

1 1 ul 1 1 

Ei = do(u)du = f E du = f (1 —u)du = =, 
0 o 0-1 0 
1 1 

1 o u— (0 o 1 
Ci = ; Ai (u)du f I0 du 5 
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Portanto, substituindo Cj e Cl em (11.5), obtemos: 


el 1 1 
fo todo = n [3f 0) + 3r 
To 
ou 
zı h 
fo todo = 5 too) + fe), (11.6) 
zo 
que é uma fórmula de Newton-Cotes, conhecida como Regra do Trapézio. 


Observe que: se o intervalo [a,b] é pequeno a aproximação é razoável; mas se [a,b] é grande o erro 
também pode ser grande. Na figura a seguir, a área hachurada é o erro cometido ao calcularmos a integral 


de a até b, usando (11.6). 


Ha) 


a = To b= zı T 
Assim, se o intervalo de integração é grande podemos dividir o intervalo [a,b] em N sub-intervalos 
de amplitude h = b—a de tal forma que zo = a; xy = be em cada sub-intervalo [x;,x;,1]), j = 
0,1,...,N — 1, aplicar a Regra do Trapézio. O erro agora é a soma das áreas entre a curva e as retas, 
como mostrado na figura a seguir: 


Ha) 


| [Tp 


a = zo 71 zo z3 = b x 
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Observe ainda que, quando h — 0, estaremos tendendo ao resultado exato da integral pois o erro 
estará tendendo a zero, como pode ser visto na seguinte figura: 


Ha) 


Pa 


Y 


a= to LT £2 ... Ln—-1 Tn = b x 


Assim, utilizando o que foi descrito, obtemos: 


[tow = f tod + f rod 


+ f” ro 


— 


K 


N| > 


[f (10) + Fe] + ËE + Fe) 


£ +Ë Er) + SEN] + 


Na expressão acima vemos que com exceção da f calculada nos pontos £o e xy, todas as demais 
aparecem duas vezes. Portanto, podemos escrever: 


TN h 
/ Hajda = 5 [f (20) +2 (F (21) + f (x2) +... + f (&n-1)) + feno, (11.7) 
To 
e assim obtemos a Regra do Trapézio Generalizada. Na prática, só utilizamos esta regra. 


Exemplo 11.2 - Calcular, usando a regra do trapézio, 


1.2 
/ e” cos q dz. 
0 


Solução: Temos que: 


£o Tı T2 T3 T4 £5 T6 

x 0 0.2 0.4 0.6 0.8 1.0 1.2 
e” 1 | 1.221 | 1.492 | 1.822 | 2.226 | 2.718 | 3.320 
cos 1 1 | 0.980 | 0.921 | 0.825 | 0.697 | 0.540 | 0.362 
e” cos x | 1 | 1.197 | 1.374 | 1.503 | 1.552 | 1.468 | 1.202 
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Aplicando, (11.7), obtemos: 


1.2 h 
/ e” cos z dr = 3 [f (xo) +2 (f (z1) +... + f (x5)) + F (xe)] 
= Co (1.197 + 1.374 + 1.503 + 1.552 + 1.468) + 1.202] 


= 01[14+2(7.094) + 1.202] 


= 0.1[1414188+1.202] = 0.1[16.39] = 1.639. 


Exercícios 


11.1 - Aplicar a regra do trapézio para calcular: 


130 
/ va da, 
1.00 
utilizando os dados da tabela a seguir: 


T | 1.00 1.05 1.10 1.15 1.20 1.25 1.30 
vz | 1.0000 1.0247 1.0488 1.0723 1.0954 1.1180 1.1401 ` 


0.8 
/ cos q dz, 
0 


pela regra do trapézio, com h = 0.4, 0.2, e 0.1, sabendo que: 


T [0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 
cos x | 1 0.995 0.980 0.955 0.921 0.877 0.825 0.764 0.696 


11.2 - Calcular: 


11.3 - Usando a regra do trapézio sobre 5 pontos, calcular: 
1.6 
I sen x da. 
1.2 


2 | 18 1.3 1.4 1.5 1.6 
sen x | 0.93204 0.96356 0.98545 0.99749 0.99957 


Sabe-se que: 


11.4 - Dada a tabela: 


T 
T 


jo 02 04 06 08 
e [1 


122 1.49 1.82 2.22 


0.8 
/ ve dr, 
0 


pela regra do trapézio usando todos os pontos. 


calcular: 
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11.5 - Provar que: CR = Cm 


Sugestão: Faça uma mudança de variável. 


2º caso: Consideremos n = 2; isto é, queremos obter uma fórmula para integrar f(x) entre três 
pontos consecutivos £o, £1 € «2 usando polinômio do 2º grau. Temos, de (11.4), que: 


IN f(x) de = 3 fe h CÈ, (11.8) 
zo k=0 
onde, de (11.3), 
CG = [ dot du = [ Gola au 
= ! [ -zuta du = 5 


C = [aoa f So au 


TE -f (u? — 2u) du = ? 


0 
e pelo exercício 11.5 temos que: C? = C = 7 
Substituindo os valores de C, k = 0,1,2 em (11.8), obtemos: 
[O toa = nitet Srt) + (eo 
Lo 


ou 


[o saido = $I) +48 (e) tF) (11.9) 


que é uma fórmula de Newton-Cotes, conhecida como Regra E de Simpson. 


De maneira análoga à regra do trapézio, a generalização da regra ã de Simpson para integração ao 
longo de um intervalo [a, b], é feita dividindo-se [a, b] num número par 2N de sub-intervalos de amplitude 
h = 2>& de tal forma que zo = a, £əy = b. Note que o número de subdivisões deve ser múltiplo de 


2N 
2, pois precisamos de dois subintervalos (e portanto de três pontos) para aplicar uma vez a regra (11.9). 


Temos então: 
[o fds MEG de ^ dida 


pen f mada: 


+ 
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Usando a regra ã de Simpson ao longo do intervalo [£z;, £j+2], j = 0,2,...,2N — 2, temos: 


K 


[o f(x) da É [f (z0) + 4f (11) + f (x2)] 


(o) 


3 
h 
3 [F (2) +4f (z3) + f(04)] 


++ È [Z (æ2n-2) + 4f (cama) + f (22x) 


Na expressão acima vemos que com exceção da f calculada nos pontos £o e von, as f calculadas nos 
pontos extremos do intervalo de integração aparecem duas vezes. Portanto, podemos escrever: 


f” ttajdo ~ ŽU (00) +49 (10) +29 (22) + 2f (00) + 4f (3) + 2f (24) 


(11.10) 
+ ...+2f(z2N—2) + 4f (ron) + f (zən) | , 


e assim obtemos a Regra i de Simpson Generalizada. Novamente, na prática, só utilizamos esta 
regra. 


Exemplo 11.3 - Usando a regra E de Simpson, calcular a integral do exemplo 11.2. 


Solução: Temos, usando (11.11), que: 


1.2 
/ e” cos x dr = 
0 


+ 2f(z4)+4f (z5) + f(x6)] 


w> 


[f (£0) + 4f (x1) + 2f (£2) + 4f (£3) 


0.2 
m [1 + 4(1.197 + 1.503 + 1.468) 4 


+ 2(1.374 + 1.552) + 1.202 ] 


= = [1 + 4(4.168) + 2(2.926) + 1.202] 


= a [1 + 16.672 + 5.852 + 1.202] 


.2 
= cê lpa 796] = 1.6484. 


Exercícios 


11.6 - Resolver os exercícios 11.1, 11.2, 11.8 e 11.4 usando a Regra ã de Simpson. 
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11.7 - A velocidade v de um foguete lançado do chão verticalmente (para cima, é claro) foi tabelada 
como se segue: 


t(seg) |0 5 10 15 20 
vlpés/seg) [0 60.6 1801 341.6 528. 4 


Usando a regra t de Simpson calcular a altura do foguete após 20 segundos. 


11.8 - Usando a regra t de Simpson, calcular: 


1.6 
/ ln z dz. 
1.0 


£ | 1.0 11 1.2 1.3 1.4 1.5 1.6 
ln ngl 0 0.095 0.182 0.262 0.3996 0.405 0.470 


Sabe-se que: 


3º Caso: Consideremos n = 3, isto é, queremos obter uma fórmula para integrar f(x) entre 4 pontos 
consecutivos £o, %1, %2, %3, usando polinômio do 3º grau. Temos, em vista de (11.4), que: 


f(x) do ~ X` fr h Ch, (11.11) 
Pg k=0 
onde, de (11.3), 

3 3 (u— — 2)(u -3 

c = aldu = f tele du 

E p OE CR E CR 
1 3 

= a (u? — 6u? + 11u — 6) du = sa 


o 3 = 3 u(u — Du — 3) 
q = | aous | ioga 


NEE a pes 5 so 
= 5) (8-mê+6u) du = 3. 


Pelo exercício 11.5, temos que: C3= Es = 3; Cs = C? = 3 


Assim, substituindo os valores de CÊ, k = 0,1,2,3, em (11.11), obtemos: 


[soar = afto) + 3r +S a) + Srt] 


J? Ha) de = ShI o) +3 (e) + Flea) + (es), (11.12) 


que é uma fórmula de Newton-Cotes conhecida como Regra 3 de Simpson. 
8 
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Para generalizar a regra : de Simpson devemos dividir o intervalo [a,b] em um número de sub- 


intervalos de amplitude h = aa de tal forma que xy = a, z3N = b. Note que o número de subdivisões 


deve ser múltiplo de 3, pois precisamos de três subintervalos (e portanto de quatro pontos) para aplicar 


uma vez a regra (11.12). Temos então: 


[o tado — fo toat f od 


i 
+ 
E—, 

a 
= 
o 
a, 
aA 
a 
F 


Usando a regra E de Simpson ao longo do intervalo [x;,7;13), j=0,3,6,...,3N — 3, obtemos: 


1 o Sede 


K 


Sh [ (xo) +3 (f (z1 ) + f) z2 )) + f (z3)] 


+ Sh [f (23) +3 (F24) + f (z5) ) + f (z6)] 


+ Žh[f (x313) +3 ((aN-2) + f (zan-1)) + f (es) - 


Novamente, na expressão acima vemos que com exceção da f calculada nos pontos £o e z3N, as demais 
calculadas nos pontos extremos do intervalo de integração aparecem duas vezes. Portanto, podemos 
escrever: 


s 
3 
z 
= 
Ra 
È 
a 
8 
1? 


Sh [F (20) +3 (f (21) + f (22)) + 2f (23) + 


+ 3(f(£4)+ f (z5) +2f (z6) +...... (11.13) 


+ 2f(z3N-3)+3(f(z3N-2) + f (z3N-1)) + f (zən) ] - 


e assim obtemos a Regra E de Simpson Generalizada. Novamente, na prática, só utilizamos esta 
regra. 


Exemplo 11.4 - Usando a regra 3 de Simpson, calcular a integral do exemplo 11.2. 
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Solução: Usando (11.13), temos que: 
1.2 
/ e? cos ede = Šh[ f (2o) +30 (21) + f (22) +24 (25) 
o 
+ 3(F (x4) + f (x5)) + f (xe) ] 
0.6 
= a [1+ 83(1197 + 1.374) + 2(1.503) 


+ 3(1.552 + 1.468) + 1.202 ] 


0.6 

= q [L+ 3(2.571) + 3.006 + 3(3.020) + 1.202] 
0.6 

= -g [L+ 7.713 + 3.006 + 9.060 + 1.202] 
0.6 


= -g [21.981] = 1.648575 . 


Observações: 


1) De maneira semelhante ao descrito nesta seção, podemos obter outras fórmulas de Newton-Cotes do 
tipo fechado. Para tanto, basta irmos aumentando o grau do polinômio de interpolação. Entretanto, 
na prática, as fórmulas mais usadas são a regra do Trapézio e as de Simpson, pois quando h > 0, 
todas tendem ao resultado exato da integral. 


2) Calculando diretamente a integral, obtemos: 


1.2 


2 er 
e” cos x dz = o (sen £+ cos 2) : 
0 0 


e usando 6 casas decimais, (trabalhando com arredondamento), segue que o resultado da integral é 
1.6487747. Assim, se compararmos os resultados obtidos nos exemplos anteriores vemos que temos 
uma casa decimal precisa quando utilizamos a regra do trapézio e três casas decimais precisas nas 
regras de Simpson. Veremos a seguir, quando estudarmos o termo do resto para as fórmulas de 
Newton-Cotes, que ambas as regras de Simpson possuem a mesma ordem de convergência e portanto 
tanto faz utilizar uma como a outra que teremos o resultado da integral com o mesmo número de 
casas decimais corretas. Uma pergunta que surge naturalmente é: porquê então duas regras? A 
resposta está no fato que a aplicação das regras dependem das subdivisões dos intervalos. Note que 
na prática podemos utilizar as duas regras de Simpson para resolver uma integral, como é mostrado 
no exemplo a seguir. 


Exemplo 11.5 - Usando a regra de Simpson, calcular a integral de O a 1.0 da função dada no exemplo 
11.2. 


Solução: Observe que neste caso não podemos utilizar apenas uma das regras de Simpson para resolver 
a integral, visto que o número de pontos, para ambas, não é adequado . Podemos entretanto utilizar a 
regra á de Simpson para integrar de 0 a 04 e a regra 3 para integrar de 0.4 a 1.0 ou então utilizar a 
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regra E de Simpson no intervalo [0,0.6] e a regra l de Simpson no intervalo [0.6, 1.0]. Consideremos a 
primeira possiblidade. Temos então: 


1.0 
J e” cos z dr & Sh LS (2o) + 4f (z1) + f (x2) ] 
0 


4 SALE (22) + 3(f (23) + f (24)) + f (25) ] 


0.2 
a [1+4(1.197) + 1.374] 


0.6 
+ -g [13744 3(1,5034 1.552) + 1.468 ] 


0.2 
= = [L+ 4.788 + 1.374] 


+ o [1.374 + 9.165 + 1.468] 


2 
= “2 (7.162) + “2 (12.007) 


= 0.477467 + 0.900525 = 1.377992 . 


Observe que não podemos aplicar as regras de Simpson com a regra do trapézio, pois esta última 
possui ordem de convergência menor, como veremos na próxima seção. 


Exercícios 


11.9 - Resolver os exercícios 11.1 e 11.8 usando a regra 3 de Simpson. 


0.6 
1 cosg dz, 
0 


pela regra 3 de Simpson; com h = 0.1. Use a tabela do exercício 11.2. 


11.10 - Calcular: 


11.11 - Usando a regra 3 de Simpson e h = 0.6, 0.2, calcular : 
1:2 
| e” sen x dz. 
0 


x 0 0.2 0.4 0.6 0.8 1.0 1.2 
e? | 1.000 0.819 0.670 0.548 0.449 0.867 0.301 
sen £ 0 0.198 0.398 0.565 0.717 0.841 0.952 


Sabe-se que: 
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11.2.2 Erro nas Fórmulas de Newton-Cotes 


Estudaremos nesta seção o termo do resto ou o erro que cometemos ao aproximar o valor de uma 
integral usando as fórmulas de Newton-Cotes do tipo fechado, isto é, estudaremos o termo R(f) dado em 
(11.1). Para tanto enunciaremos dois teoremas, cujas demonstrações aqui omitidas, podem ser encontra- 
das, por exemplo em [Jennings, 19..], e cujos resultados são extremamente importantes. 


Teorema 11.2 - Se os pontos zj = vo + jh, j = 0,1,...,n dividem [a,b] em um número ímpar de 
intervalos iguais e f(x) tem derivada de ordem (n+ 1) contínua em [a,b], então a expressão do erro para 
as fórmulas de Newton-Cotes do tipo fechado, com n ímpar, é dada por: 


n+2 e(n+1) n 
R(f) = AE S u(u— 1)... (u= n) du, 


para algum ponto E € [a,b]. 


Teorema 11.3 - Se os pontos zj = zo + jh, j = 0,1,...,n dividem [a,b] em um número par de 
intervalos iguais e f(x) tem derivada de ordem (n+ 2) contínua em [a,b], então a expressão do erro para 
as fórmulas de Newton-Cotes do tipo fechado, com n par, é dada por: 


n+3 e(n+2) n ñ 
R(f) = DÊ f (1-5) u(u— 1D)...(u—n) du, 


para algum ponto E € [a,b]. 


Assim, o erro da fórmula trapezoidal sobre o intervalo [zo, x1] é obtido do Teorema 11.2, colocando 
n = 1, isto é: 


3 1 
Ra) = RO f tuqu 1) du 
2 BRO Pa 
=- E [ud 


- ege (a) 


Portanto o erro, ao aplicarmos uma vez a regra do trapézio, é dado por: 


3 gn 
R(f) = — - A A to < E <tr- (11.14) 


Assim, podemos escrever: 


zı 3 
f tod = 5 etse- GIO i wesa. 
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O erro na fórmula do trapézio generalizada é obtido adicionando-se N erros da forma (11.14): onde 


-b-a f 
N= h . Logo: 


Po tade = Lite) +20 (0) +... + flen) fen) 


0 


Observe que o termo do resto não deve, na prática, ser subtraído do resultado aproximado, obtido 
pela aplicação da regra do trapézio, visto que nunca conseguíriamos o resultado exato, pois o ponto é que 
fornece a igualdade, existe e é único mas não temos como determiná-lo. Assim a aplicação da fórmula do 
termo do resto é útil quando queremos o resultado com uma precisão pré-fixada, como mostraremos no 
exemplo a seguir. 


Exemplo 11.6 - Determinar o menor número de intervalos em que podemos dividir [0,1.2] para obter: 


1.2 
/ e” cos x dz, 
0 


pela regra do trapézio com três casas decimais precisas. 


Solução: Como queremos determinar o menor número de intervalos, devemos usar a expressão do erro 
para a fórmula do trapézio generalizada. Assim: 


h3 
RG) = o S'O, mo <E<am, 
Nh? 
> IROI < o ex, IPO, (11.15) 


desde que não podemos determinar f” (€). Devemos então calcular a derivada segunda da f e avaliar seu 
valor máximo no intervalo [0, 1.2]. Temos: 


ft) = e cost , SFf(t)=e(cost-sent), 
F) = ecos t— sent) — e (sen t+ cos t) 


> ft) = —-2e sent. 
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Portanto: 
"Œl = 1.2) = 2(3.320)(0.932) = 6.188. 
neo e O= (3.320)(0.932) = 6.188 
Substituindo o valor máximo da derivada segunda em (11.15), lembrando que h = eo = 
120 — Ie, e impondo que o erro seja < 0.5 x 1072, pois queremos o resultado com três casas 


N 
decimais corretas, obtemos: 
2 
R(f) < 1iló(oiss) < 05 x 10º 
> h? < 0.0000808 


= h < 0.02842 . 


Observe que devemos escolher o maior h, que seja < 0.02842, mas que divida exatamente o intervalo 


0,1.2]. Assim, escolhemos h = 0.025, e usando o fato que N = b— 4 obtemos que Nmin = 48. Assim 
h 


P OR : SEENE 1.2 
devemos dividir o intervalo [0,1.2] em 48 sub-intervalos iguais para obter fj“ e” cos x dx pela regra do 
trapézio com três casas decimais precisas. Compare com as regras de Simpson, onde a mesma precisão é 
obtida com um número muito menor de subintervalos. 


Para obtermos o erro na fórmula $ de Simpson, sobre o intervalo [xo, £2], substituimos n por 2 no 
Teorema 11.3. Assim: 


5 (V) 2 
R) = HTE S -Duuu 2) du 
q TE -9 f Í (ut — 4u? + 5u? — 2u) du 


oN 5) 
4! 15) ` 


Portanto o erro, ao aplicarmos uma vez a regra de Simpson, é dado por: 


5 
R(f) = — K POOE , m<E<am. (11.16) 


Então, podemos escrever: 


T2 5 
fo tods= 5 (oo) +48 (e) +) — AE, co <E <a. 
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O erro na fórmula E de Simpson generalizada é obtida adicionando-se N erros da forma (11.16) onde 


N= b2. Assim: 


[ f (£0) + 4f (£1) + 2f (x2) 


s 
S 
z 

+ 
Pq? 
È 
a 

8 

II 
w| > 


+ ...+2f(z2N—2) + 4f (z2əN—1) + f (zən) ] 


Nhô 


90 JEVE) „To < Ẹ < ToN. 


wI > 


[ f (xo) + 4f (x1) + 2f (x2) 
+ -..+2f (z2N—2) + 4f(xon-1) + f (von) ] 


= 4 
= JEVE) „Zo < Ẹ < ToN. 


Deixamos como exercício verificar que a expressão do erro para a regra 3 de Simpson, e para regra 3 


de Simpson generalizada, são dadas, respectivamente, por: é dada por: 


RG) = -ERIE , ro<E<ss, 


, - (b-a) 
desde que N = z 


Observações: 


1) Pelas expressões do erro, vemos que as fórmulas de Simpson são da ordem de h4, em símbolo, O(h?), 
enquanto que a regra do trapézio é da O(h?). Assim, as regras de Simpsom possuem a mesma ordem 
de convergência, portanto ambas convergem para o resultado exato com a mesma velocidade. Para 
exemplificar o significado da importância da ordem de convergência, consideremos que a aplicação 
das regras de Simpson com um determinado h fornecem o resultado com um erro inferior a 1078. 
A aplicação da mesma regra com h = tó fornecerá o resultado com erro inferior a 1077. Por outro 
lado se o resultado da aplicação da regra do trapézio tiver erro inferior a 1071, com um determinado 
h, então o erro será inferior a 1073 com h = h. Portanto quando h — 0, as regras de Simpson 
convergem mais rapidamente para o resultado exato da integral. 


2) Apesar da fórmula l de Simpson ter sido obtida aproximando-se a função por polinômio de grau 2, 
ela é exata também para polinômios de grau 3, visto que na fórmula do erro aparece a derivada 
quarta da função f. Pode ser demonstrado que se n é par então as fórmulas de Newton-Cotes do 
tipo fechado têm grau de precisão n + 1. 


3) Para obter o resultado de uma integral com uma determinada precisão, podemos utilizar a fórmula 
do erro, impondo que a mesma, em módulo, seja inferior a 0.5 x 10-*, onde k é o número de casas 
decimais corretas que desejamos no resultado, e assim obter o número de intervalos necessários, (ver 
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exemplo 11,5), ou ir aumentando o número de pontos e comparando dois resultados consecutivos, 
até obter a precisão desejada, como é mostrado no exemplo a seguir. Na prática usamos esta 
segunda possiblidade. 


Exemplo 11.7 - Usando a regra : de Simpson, obter a integral do exemplo 11.2, com 2 casas decimais 
corretas. 


Solução: Inicialmente calculamos a integral usando apenas 3 pontos. Assim: 
1.2 1 
/ e” cos zdr S zI S(O) + 4f (0.6) + f (1.2) ] 
0 
1 
E 3(0.6)(1 + 4(1.503) + 1.202) 


= 1.6428 = Í; 


Agora calculamos a integral com 5 pontos. Assim: 


K 


E e? cos zde & ELAO) +47 (0.3) +27 (0.6) + 4f (0.9) + (1.2) ] 
0 


= z030 + 4(1.289) + 2(1.503) + 4(1.530) + 1.202) 


= 1.6464= 5 


desde que f(0.3) = 1.289 e f(0.9) = 1.530. Comparando I; = 1.6464 com 13 = 1.6428 vemos que as duas 
primeiras casas decimais permanecem inalteradas. Portanto o valor da integral com duas casas decimais 
corretas é 1.64. 


Observe que o exemplo dado ilustra o procedimento a ser adotado, no computador devemos tomar 
h — 0, isto é: h = 0.1,0.01,... e ir comparando os resultados. 


Exercícios 


11.12 - Determine h de modo que a regra do trapézio forneça o valor de: 
1 2 
Los / edi. 
0 


11.13 - Achar o número mínimo de intervalos que se pode usar para, utilizando a regra l de Simpson, 


obter 
n/2 
/ e” cos x dz, 
0 


com erro inferior a 0.5 x 1078. 


com 4 casas decimais corretas. 
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11.14 - Determinar h de modo que a regra É de Simpson forneça o valor de 


0.8 
p sen x dz, 
0.2 


com erro inferior a 0.5 x 1073. 


11.3 Polinômios Ortogonais 


Ao lado das fórmulas de Newton-Cotes para integração numérica, as fórmulas de quadratura de 
Gauss, a serem definidas mais adiante, se destacam por fornecerem resultados altamente precisos. Tais 
fórmulas, baseiam-se em propriedades de polinômios ortogonais os quais passamos a estudar agora. (Para 
melhor entendimento das propriedades reveja os conceitos de base ortogonal, mudança de base e produto 
escalar, dados no Capítulo 1). 


Sejam do(x), pi(x), da(x),..., uma família de polinômios de graus 0,1,2,.... 
Se: 
(Pi(x), d(x)) = 0 » para ifJ , 
e (11.17) 
(dilx),dilx)) £ 0 , para ġi #0, 


então os polinômios do(x), pi(x), ¢2(£),... se dizem ortogonais. 


Neste estudo, estamos considerando o produto escalar: 


b 
uge I w(2) f(x) g(2) de, (11.18) 


com w(x) > 0e contínua em [a,b], onde w(x) é a função peso. 
Os polinômios ¢;(x), i = 0,1,2,..., podem ser obtidos pela ortogonalização da sequência {1, x,12,...) 
(usando o processo de ortogonalização de Gram-Schmidt (Capítulo 1)) ou, através do seguinte: 


Teorema 11.4 - Sejam os polinômios do(x), di(x), pa(a),..., de graus 0,1,2,..., definidos por: 
do(a) =1 , 


(x Po(0), do(0)) 


o = (2,1) 
Pie) = 2 Too(O), gola) PO = 2 s 


(1,1) (11.19) 


e, parak=1,2,3,..., 
Pkyiı(x) = x oklx)— akprlx) — Bk $k-1(2) , 


onde: 
e= (x orl), pkl) ea (rlx), dnlx)) 
(d(x), de(x)) (k-12), droa(a)) ` 


Os polinômios po(x), ¢ı(x£), da(x),..., assim definidos, são dois a dois ortogonais, isto é, satisfazem 


EM 
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Prova: Faremos a prova por indução. 


a) Inicialmente, temos que: Qi(x) e Po(x) são ortogonais. De fato: 


ahga) = (2- ER 11) = 


= Wp e Al aa 


b) Supondo (¢;(x), ġ;(x)) = 0, para i Æ j, i,j =0,1,...,k. 
c) Provemos que (ġk+1(£), blz) = 0, j=0,1,...,k. 
Dividiremos a prova em três partes. 
c.1) Consideremos inicialmente j = k. Temos então: 


(ġr+1(x), Pela) = (xóplx) — axdelx) — brok-1ı(2), de(x)) 
= (xdulx), dulx)) — ax (del), delx)) — brk (Proa(x), del) 


= (woale), óu(0)) — GELL) (gua), bula) = 0. 


desde que, pela hipótese de indução, k—ı(x) e k(x) são ortogonais, e onde substituímos ay. pelo 
valor dado no teorema. 


c.2) Para j= k — 1, temos: 
(pr+1(2), k-1(2)) = (uórla) — andelm) — Prpr-ı(2), Oral) 
= (uónla), dr-a(x)) — ar (elx), droa(a)) — Br (Pr-1(2), Proa(a)) 
= (óu(x),vdr(x)) — Pr ($r-1(2), $r-1(2)) , 


desde que estamos utilizando o produto escalar definido por (11.18), e novamente aplicamos a 
hipótese de indução. 


Mas, 
(k(x), £ør-1(2)) = (k(x), dela) - 


De fato, usando (11.19), temos, para k = 1, que: 
(oil), xdo(r)) = (dilx),x) 


' COLG + CIDE) gofa ) 


= (xóo(x), Po(x)) 
= (¢ı(x), pala) T% a NEN (diz), do(x)) 
= (di(x), ġı(x)), 
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desde que ó(x) e Go(x) são ortogonais; e, para k > 1, 
(r(x), dela) = (dulx), ala) + arordr-(a) + Bros dr-a(a)) 
= (k(x), dela). 
desde que pela hipótese de indução &k-1(x) e &k-2(x:) são ortogonais. Então, finalmente, temos: 
(Oraa(x), r-1(2)) = (dr(x), dela) — Be (r-1(2), Oeoala)) =0, 
desde que 


os (dela) — dela) l 
dr-i(x), dr-(x)) 


c.3) Vamos considerar agora j = k—2,k-—3,...,1,0. Assim: 
($rk+1(2), Oj()) (uónla) — arpels) — Brdr-i(a), dy(x)) 
= (ont), xd;(x)) — ar (Pula), dy(x)) — Br (k-12), (x) 
= (ónla),vd(x)) 
= (dula), Pjala) + asda) + Bjby-a(a)) 
= (ónla), pj+(2)) + as (Pula), dy(x)) + lkl), Pjoa(a)) 


0 , pois y<k-—1. 
Portanto, os polinômios definidos em (11.19) são dois a dois ortogonais. 


Observe que obter uma sequência de polinômios ortogonais pelo Teorema 11.4 é muito mais fácil do 
que obtê-los através do processo de ortogonalização de Gram-Schmidt. Muito mais fácil, pois o Teorema 
anterior fornece uma fórmula de recorrência que envolve apenas três termos para obter qualquer polinômio 
da sequência de grau k > 2, enquanto que o processo de Gram-Schmidt requer o cálculo de k — 1 termos 
para obter o polinômio de grau k, k=1,2,.... 

11.3.1 Principais Polinômios Ortogonais 


A sequência de polinômios do(x), di(x), pa(x),..., evidentemente, depende do produto escalar ado- 
tado (forma geral (11.18)). Os mais conhecidos (inclusive já tabelados) e com os quais trabalharemos são 
os seguintes: 


Polinômios de Legendre 


Os polinômios de Legendre Po(x), P(x), ..., são obtidos segundo o produto escalar: 


(1,9) = I He) do) do, (11.20) 


isto é, com w(x) = 1, a= —1 e b=1. 
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Polinômios de Tchebyshev 


O produto escalar usado para obter os polinômios de Tchebyshev To(x), Ti(x),... é dado por: 
: 1 
10) = —— f(x) glx) dz, 11.21 
(69) = f aa O slo) (11.21) 
a = 1 = 
ou seja, w(x) VI a l1 e b=1. 


Polinômios de Laguerre 


Os polinômios de Laguerre Lo(x), Lı (x), ..., são obtidos usando-se o produto escalar: 


TE / “ER fa) o(a) de; (11.22) 


—T 


portanto, w(x) = e77, a=0 e b=. 


Polinômios de Hermite 


Obtemos os polinômios de Hermite, usando o produto escalar: 


(o) = | e Ha) g) de, (11.23) 


—00 


isto é, w(x)=e”,a=-oc e b=. 


Exemplo 11.8 - Obter os primeiros polinômios de Legendre. 


Solução: Para obter os polinômios de Legendre, devemos utilizar o Teorema 11.4 e o produto escalar 


definido por (11.20). Assim: 
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Po(x) 


P(x) 


= P(x) 


pı 


=> P(x) 


1 

„(1 
(1,1) 

= fe dx 
Si dx 
elo E 
de = 

z. 


x P(x) — a P(x) = BiPo(a), 


(zPi(z), Pio) Jr de 


(Pv), Pia) fade 
q4/4 i o 

k = 

(Pao P(m) _ fi 2? de 
(Po(x), Po(x)) [dz 
23/37 | 2/33 1 
2 Ei A 

r +0xz--x1 = r? — > 


11.3.2 Propriedades dos Polinômios Ortogonais 


onde 


344 


Vejamos algumas das propriedades dos polinômios ortogonais que serão importantes para a obtenção 


das fórmulas de Quadratura de Gauss. 


Propriedade 1 - Sejam do(x), di(x), da(x),.. 


., polinômios ortogonais, não nulos, segundo um pro- 


duto escalar qualquer. Então, qualquer polinômio de grau menor ou igual a n pode ser escrito como 


combinação linear de Go(x), di(x),... 


Prova: Os polinômios do(x), di(x),... 


b) n(x). 


n(x) constituem uma base para o espaço dos polinômios de 
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grau menor ou igual a n. Assim, se Q(x) é um polinômio da forma: 
Q(z) = aotazrx+...+aça”, 
então Q(x) pode ser escrito, através de mudança de base, como: 


Q(x) = bodolr) + bipi(x) +... + bndnla). 


Propriedade 2 - Sejam do(x), di(x),..., n(x) nas condições da propriedade 1. Então n(x) é orto- 
gonal a qualquer polinômio Q(x) de grau menor que n. 


Prova: Seja Q(x), um polinômio de grau n — 1. Pela propriedade anterior temos que: 


Q(x) = bopolx) + brdilr) +... +ba-idn-a(a), 


então: 


(Ql), Pn(x)) 


I 


(bopols) + bidila) +... + bn-1pn-1(2), Gn(x)) 


bo(do(x), dn(x)) + bi(di(a), On(x)) ore bn-1(Pn-1(x), On(x)) 


= 0 


desde que os polinômios do(x), di(a),..., n(x) são dois a dois ortogonais. 


Propriedade 3 - Sejam do(x), di(x), do(a), ..., polinômios ortogonais segundo o produto escalar: 
b 
(o) = f w) Fæ) a(o) de, 


com w(x) > 0 e contínua em [a,b]. Então n(x) possui n raízes (reais) distintas em [a, b]. 


Prova: Para verificar a veracidade desta propriedade dividiremos a prova em três partes, isto é, prova- 
remos que: 


a) n(x) possui algum zero em fa, b], 
b) os zeros de n(x) em [a,b], são simples, 
c) os n zeros de n(x) estão em [a,b]. 


Os três itens serão provados por absurdo. Assim, para provar a), vamos supor, por absurdo, que 
n(x) não possui zeros em [a,b]. Portanto em [a,b], n(x) £ 0. Assim: 


b 
CHORO / 2) bal£) dola)de 


I 


b 
i (2)ónla) de £ O, 


desde que Go(x) = 1, w(x) > 0, mas não pode ser identicamente nula, e n(x) £ 0 em fa, b]. 
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Mas n(x) e olx) são ortogonais, e portanto (n(x), do(x)) = 0. Logo é um absurdo supor que 
n(x) não possui zeros em [a,b]. 


Para provar b) vamos supor, por absurdo, que exista uma raiz de n(x) que seja de multiplicidade 2. 
Seja x, essa raiz. Portanto: 


(a = zı)? i 


é um polinômio de grau n — 2. Assim, pela propriedade 2: 
(palt), 3) = 0. 


Mas, usando as propriedades de produto escalar, obtemos: 


Onax) na df nla) 
ah E) = f ela) a de 


(x 


b 


xz — z1) (x — z1) 


(x — z1)’ (£ — z1) z 0, 


m 


onde a igualdade é válida se e somente se pés. for o polinômio nulo. Portanto é um absurdo supor 
= 


que os zeros de n(x) em [a,b] não são simples. 


Finalmente, para provar c) vamos supor, por absurdo, que exista apenas j zeros de n(x) em [a,b), 
com j <n. Sejam x1,%2,...,%; OS zeros de ġn(x) em [a,b]. Então, podemos escrever: 


Pnz) = (x= z1)(x — 22)... (£ — zj)qn-; (T) 


onde q,-; #0 em [a,b]. Assim, pela propriedade 2, segue que: 


(n(x), (£ — x1) (£ — z2)... (x — xj)) = 0. 
Mas, usando as propriedades de produto escalar, temos que: 


(n(x), (x — z1)(z — x2)... (£ — 2;)) = 


I 


b 
f w(x)(x — x1)... (x£ — zj)qn-;(£)(x — z1)... (£ — x;) de 
b 
E f w(s)(2— 21)? ... (£ 2 qa-;(2) de + 0. 


Portanto, é um absurdo supor que os n zeros de n(x) não estão em [a, b]. 


Assim, acabamos de provar que n(x) possui n zeros (reais), distintos em |a, b]. 
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Propriedade 4 - Sejam do(n), di(x), da(x),..., nas condições da propriedade 3. Sejam zo, £1,... 


as raízes de Gn41(x). Se f(x) é um polinômio de grau menor ou igual a 2n + 1, então: 


b n 
foco) to) do = Y> As Fl) , 
a k=0 


onde 5 
Ap = f w(x) Lula) dz. 
Prova: Como x9,%1,..., Un são raízes de Yn+1(1), podemos escrever: 
Pn41(£) = ao(z — xo) (x£ — z1)... (£ — Tn). 
Seja Pa(x) o polinômio de interpolação de f(x) sobre £o, £1,...,&n em fa, b]. Sabemos que: 


onde Rn(1) é o erro na interpolação. Assim: 


coma<é<b e é dependendo de x. 


Então, em vista de (11.25) e de que £ é função de x, podemos escrever: 


RO 


Fx) — Palz) = bo n412) ICE SUE 


Como f(x) é um polinômio de grau menor ou igual a 2n + 1, temos que: 


petola) 
q(x) = mI’? 


é um polinômio de grau menor ou igual a n. Assim, podemos escrever: 
f(z) — Pa(x) = bo n+1(2) q(2) . 
Integrando (11.26) de a até b, com a função peso w(x), obtemos que: 


b b 
/ ut ita -= tdi de= / ati Bad) tio a 


Pela propriedade 2, o lado direito da igualdade acima é igual a zero. Assim: 


b 
/ w(e) Ux) — Palo] de = 0, 


347 


Tn 


(11.24) 


(11.25) 


(11.26) 


CAPÍTULO 11. INTEGRAÇÃO NUMÉRICA 348 


ou 


I Fere E L it 


Il 
— 
= 
B 


Portanto, fica provada a relação (11.24). 


Esta propriedade garante então que, para integrar um polinômio de um certo grau k, basta traba- 
lharmos com um polinômio ortogonal de grau aproximadamente k/2. E mais, descartados os erros de 
arredondamento, o resultado deve ser exato. 


11.4 Fórmulas de Quadratura de Gauss 


São fórmulas usadas para se calcular: 


/ “td 


valendo-se do resultado da propriedade 4. Calculamos o valor aproximado da integral usando: 


b n 
foco) to) de = DD Att) 
ci k=0 
onde: 
b 
Ar = | o(a) bla) de, 
a 
e Le(x) são os polinômios de Lagrange sobre as raízes £o, £1,..., £n de Øn+1(2). 
Assim, o procedimento para se calcular uma integral usando Quadratura de Gauss, é o seguinte: 


a) determinar o polinômio ortogonal q, +1(%), segundo o produto escalar conveniente, isto é, com a 
função peso w(x) e no intervalo [a,b]. 


b) calcular as raízes £o, £1,..., £n de n+1ı(x). 

c) determinar os polinômios de Lagrange ly. (x), k = 0,1,...,n, usando os pontos zo, £1, ..., n obtidos 
em b). 

d) calcular A = f? w(x) lula) de, k=0,1,...,n. 
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e) calcular o valor de f(x) em zo, £1,..., 2n. 


f) calcular, finalmente, 


b n 
i w(x) f(x) de = 5 Ak f (£k). 
a k=0 


Exemplo 11.9 - Usando quadratura de Gauss, calcular: 


f -so de. 


1 


Solução: E claro que para resolver esta integral não precisamos de método numérico, entretanto este 
exemplo servirá para ilustrar como resolver uma integral usando o procedimento dado anteriormente. 


Na integral, vemos que a = —1, b=1, w(x)=1, e f(x) = a? — 5x. Assim f(x) é um polinômio de 
grau 3, e pela propriedade 4, temos que: se f(x) é um polinômio de grau 2n + 1, o resultado da integral 
é exato ( a menos de erros de arredondamento). 


Portanto, fazendo 2n + 1 = 3, obtemos que n = 1. 


Assim, devemos utilizar os zeros de dnsi(x) = do(x), para resolver a integral. O produto escalar, 
para obter do(a), será: Ja f(x) g(x) dx. Logo o polinômio procurado é xz? — 1 (ver exemplo 11.8). 


Portanto, fazendo x? — l = 0, obtemos zo = —0.57735 e xı = 0.55735 , (que são os zeros de do(a) 
em [-1,1]). 


Temos que: 
(x — 21) (x — xo) 
£ = L = 
o(x) (xo — 21) 1(7) (z1 — z0) 
e portanto: 
1 1 
(x — x1) 
Ao = Lola) dz = y d 
i -1 olz) -1 (£o — z1) 
1 E 1 r? 
= x — z1) dz = — — (x a 
mo, e-m de= 5 tem) 
5 —2rı 
A —2rı 
2 
desde que zo = —z1 € Z a = 0. Do mesmo modo: 


Ay 


Il 
= 
êss 
am 
Pa 
È 
a 
8 
| 
— 
Pa 
8 
| 
8 
[e 
a 
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Agora, calculamos a f nos zeros de ġə(x). Assim: 


flxo) = f(-0.57735) = (-0.57735)3 — 5(—0.57735) , 


fla) = f(0.57735) = (0.57735)? — 5(0.57735). 


Finalmente, podemos calcular a integral, isto é: 


1 
/ r? — 5x dz = Ao f(zo) + A f(z) 


—1 


= 1x [(-0.57735) — 5(-0.57735)] 


+ 1x [(0.57735)? — 5(0.57735)] = 0. 


Observação: O procedimento dado é válido para qualquer produto escalar. Quando particulariza- 
mos o produto escalar aos já mencionados anteriormente, isto é, quando usamos os produtos escalares 
para obter os polinômios de Legendre, Tchebyshev, Laguerre e Hermite, necessitamos apenas efetuar os 


passos e) 


e f) do procedimento dado anteriormente, pois os valores de x; e Ay já estão tabelados, 


(as tabelas encontram-se no final deste capítulo). Neste caso, temos as fórmulas de quadratura de 
Gauss-Legendre, Gauss-Tchebyshev, Gauss-Laguerre e Gauss-Hermite. 


Antes de descrevermos cada uma destas fórmulas daremos as 


INSTRUÇÕES PARA O USO DAS TABELAS 
1- Tabelas 1,2 e 4 


a) 


b) 


c 


xw 


a) 


Os valores de x; e A; são apresentados na forma normalizada, isto é, na forma 0. ... x 105, 
onde j aparece, entre parêntesis, antes do número. Quando não aparecer a potência, significa 
j=0. 


Cada valor é dado com 10 casas decimais. No livro de [Stroud, 19..], esses valores são apre- 
sentados com 30 casas decimais, agrupadas de 10 em 10 para facilitar a leitrura. 


Nas tabelas N significa o número de pontos que devemos tomar para resolver a integral. 
Observe que da teoria tiramos o valor de n o que implica que devemos tomar n + 1 pontos. 
Assim N =n+1. 


Como o intervalo de integração é simétrico em relação à origem, as raízes x; também o são. 
Na tabela aparece apenas x; sem sinal; então, devemos considerar + x;. Por exemplo: tabela 
1: N = 3, temos n = 2, isto é, £o, zı e £2. Neste caso xy = —0.77459...; 4 = 0 e 
zə = +0.77459.... 


Os 4; são sempre positivos! Observe que devemos tomar para A; os valores que estão na mesma 
linha dos x;, isto é, considerando os pontos x; do item d) teremos: Ag = 0.55555..., A = 
0.88888..., e A, =0.55555.... 
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2 - Tabela 3 
Uso análogo às tabelas 1, 2 e 4 com uma única exceção: 


Os x; são sempre positivos e estão todos tabelados. Por exemplo, para N = 3 aparecem 3 valores 
de Ti. 


Observe que em todas as tabelas podemos tomar os valores de x; em qualquer ordem, mas para cada 
x; devemos tomar o valor A; correspondente. 


Daremos a seguir as fórmulas de quadratura de Gauss-Legendre, Gauss-Tchebyshev, Gauss-Laguerre 
e Gauss-Hermite. Assim: 


11.4.1 Fórmula de Gauss-Legendre 


Para utilizar a fórmula de Gauss-Legendre a integral a ser calculada deve ter a função peso w(x) = 
1,a=-1 e b=1. Caso o intervalo de integração não coincida com o intervalo [—1,1], devemos fazer 
uma mudança de variável. Daremos a seguir alguns exemplos. 


Exemplo 11.10 - Resolver a integral do exemplo anterior, isto é, calcular: 
1 
f (£? — 5x) de, 
—1 
usando quadratura de Gauss. 


Solução: Como w(x) =1 , a= —1 e b= 1, estamos nas condições de utilizar a fórmula de Gauss- 
Legendre. Pelo exemplo 11.9, vemos que devemos utilizar os zeros de ģə(x), desde que f(x) é um 
polinômio de grau 3. Assim, pela Tabela 1, (ao final deste capítulo), com N = n + 1 = 2, temos que: 


zo = —0.55735, Ao = (1)0.10000 = 1 = Ai, 
zı = 0.55735. 

Portanto: 
flxo) = f(-0.57735) = (—0.57735) — 5(—0.57735) , 
fla) = £(0.57735) = (0.57735) — 5(0.57735). 


Finalmente, podemos calcular a integral. Assim: 


1 
j x? — 5x de = Ao f(xo)+ A f(x) 


—1 


= 1x [(-0.57735) — 5(-0.57735)] 


+ 1x [(0.57735)? — 5(0.57735)] = 0. 
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Exemplo 11.11 - Calcular: 
2 
da 


1 T 


usando quadratura de Gauss-Legendre. 


Solução: Como o intervalo de integração não coincide com o intervalo [-1,1] de definição do produto 
escalar de Legendre, devemos fazer uma mudança de variável. Assim: 


quando ax = 1 devemos ter t = -l, 


quando x = 2 devemos ter t = 1. 


A equação da reta que passa por (1,2) e (—1,1) pode ser obtida calculando-se o seguinte determinante 
e igualando-o a zero, isto é: 


1 
1| = —2r+t+3=0. 
1 


1 
e dx = = dt. 
x e T 2 


f2-f 1 TESI dt 
ieg ~ Ja (t3) D CEE e 
its 
Estão, agora, satisfeitas as condições da fórmula de quadratura de Gauss-Legendre com w(x) = 1, a = 


-1, b=1e f(t) = pls. 


Portanto: 


Como f(t) não é um polinômio, não temos maiores informações sobre o grau do polinômio a ser usado. 
Assim, resolveremos esta integral fixando n = 2. Mais adiante nos preocuparemos com a precisão do 
resultado. 


Da Tabela 1, com N = n + 1 = 3, obtemos: 


to = —0.7746 , Ao = 0.5556 = Az, 
t = 0, A = 0.8889 , 
t2 = 0.7746 . 
Assim: 
1 
bh Es, eo ns OAA 
f (to) —0.7746 +3 i 
fa) = 1 L 0.3333 
O p i 
1 


= 0.2649 . 


I 


f (t2) 0.7746 + 3 
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Logo: 
1 1 2 
— dt x A t 
I i t+3 > e $ (tx) 
= (0.4494 + 0.2649) (0.5556) + (0.3333) (0.8889) 
= 0.6931. 
Portanto: 


Observe que: 


a) A solução exata é: 


2 
| d£ L in 2 = 0.693147180... 
1 


x 


b) Usando quadratura de Gauss, com n = 4 e 9 casas decimais obtemos: 


2 dy 
/ œ~ 0.693147156 . 
1 


T 


que pode ser considerado um bom resultado. 


11.4.2 Fórmula de Gauss-Tchebyshev 


Para utilizar as fórmulas de Gauss-Tchebyshev a integral a ser calculada deve ter a função peso 
a= -—1 e b= 1. Novamente, caso o intervalo de integração não coincida com o 


1 
EE 
intervalo [—1,1], devemos fazer uma mudança de variável. Daremos a seguir alguns exemplos. 


Exemplo 11.12 - Usando quadratura de Gauss, calcular: 


1 


sent, 
——— dz. 
nir V 1— x? 
Solução: Temos que: w(x) = A 1 > a= -—l, b=1 e f(x) = sen x. Portanto estamos nas condições 
— a 


de utilizar a fórmula de Gauss-Tchebyshev. Como f(x) não é um polinômio não temos como obter o 
número exato de pontos para calcular a integral. Assim, fixemos n = 2. Da tabela 2, com N =n+1=8, 


obtemos: 
—0.8860 , 


Š 
I 


ty = 0, Ao = A = A = (1)0.10472 = 1.0472, 
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Coloque sua máquina de calcular em radianos para calcular o valor da f nos pontos x;, i = 0, 1, 2. 
Assim: 


f(xo) = f(-0.8860) = sen (-0.8860) = —0.7617 = —f(a»), 
Ha) = f0) = sen0 = 0 
Portanto: R 
É de = 1.0472 (—0.7617 + 0 + 0.7617) = 0. 
—1 VI- r2 


Exemplo 11.13 - Calcular: 
Í Pt 
-2 4V4- / 
exatamente, a menos de erros de arredondamento, usando quadratura de Gauss. 


Solução: Como o intervalo de integração não coincide com o intervalo [—1,1], devemos fazer uma 
mudança de variável. Assim: 


quando t = —2 devemoster x =-l, 


quando t = 2 devemos ter q = 1. 


Novamente, a equação da reta que passa por (—2,2) e (—1,1) pode ser obtida calculando-se o seguinte 
determinante e igualando-o a zero, isto é: 


t x 1 
=2 =1 1| =t = 2r =0. 
2 1 1 


Resolvendo esta equação, obtemos: 


Portanto: 
A tê + 24 T (2x)? + 2(21)? e 
e) 4 v4— t2 Sif 4 4— (2x)? 
1 3 2 
S ð / 8xº + 8x dz 
—1 8 vV 1— z2 


1 
r? + q? 


—— dz. 
—1 y1 -— z2 £ 


, a= -—1,b=1 e f(x)= zx? + z?, e portanto estamos nas condições 


= 2 


Assim temos: w(x) = 


1 
V1- q? 
da fórmula de Gauss-tchebyshev. 


Vemos que f é um polinômio, o que era de se esperar, pois queremos calcular a integral exatamente, 


(a menos de erros de arredondamento). Fazendo 2n + 1 = 3 obtemos que n = 1, ou seja, devemos tomar 
2 pontos. Da tabela 2, com N = 2, obtemos: 


—0.7071 , Ao = A = (1)0.15708 = 1.5708 , 


I 


To 


0.7071. 


I 


Tı 
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Agora: 
f(xo) = (-0.7071)8 + (—0.7071)? = 0.1464 , 
f(x) = (0.7071) + (0.7071)? = 0.8535. 
Portanto: 
2 tê 242 1 3 2 
A pi a, md = 2 | sa a ji 
-2 4 (4-2) -1 (1—2?) 


= 2x 1.5708 (0.1464 + 0.8535) 


= 3.1413. 


Observe que sempre falamos em obter o resultado exato, ( a menos de erros de arredondamento), 
pois não trabalhamos com todas as casas decimais disponíveis nos x; e nos A;. Assim, teoricamente, o 
resultado deveria ser exato, mas na prática ele depende da quantidade de dígitos significativos com que 
trabalhamos. 


11.4.3 Fórmula de Gauss-Laguerre 


Para utilizar a fórmula de Gauss-Laguerre a integral a ser calculada deve ter a função peso w(x) = 
e*,a=0 e b= oœ. Novamente, caso o intervalo de integração não coincida com o intervalo [0, oc], 
devemos fazer uma mudança de variável. Daremos a seguir alguns exemplos. 


Exemplo 11.14 - Usando quadratura de Gauss, calcular: 


(0.6) 
/ e” cos q dz. 
0 


Solução: Como w(x) = e , a=0 e b= œ, estamos nas condições da fórmula de quadratura de 
Gauss-Laguerre. Desde que f(x) = cos x, não temos condições de determinar o número exato de pontos 
que devemos tomar para resolver a integral. Assim fixemos n = 2. Portanto pela Tabela 3, com N = 3, 
obtemos: 


to = 0.4158, Ao = 0.7111, 
zı = (1)0.22943 = 2.2943, A, = 0.2785, 
z2 = (1)0.62900 = 6.2900 , As = (—1)0.1039 = 0.01039 . 
Agora: 
f(zo) = f(0.4158) = cos(0.4158) = 0.9148 , 
f(x) = f(2.2943) = cos(2.2943) = —0.6620 , 
f(z2) = f(6.2900) = cos(6.2900) = 1.0. 
Portanto: 
f e” cos x dx = 0.7111 (0.9148) + 0.2785 (—0.6620) + 0.01039 (1.0) 
0 


= 0.4765. 
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Exemplo 11.15 - Calcular, usando quadratura de Gauss, 


oo 
l ex? de. 
1 


Solução: Aqui, o intervalo de integração e do produto escalar não coincidem. Então devemos fazer 
uma mudança de variável. Como um dos limites de integração é infinito não podemos utilizar a equação 
da reta para obter a mudança de variável. Nesse caso devemos fazer a mudança de variável via cálculo. 
Assim, se tomarmos x = z + 1, teremos: 


quando x= 1 > z=0: equandox=o > z=% ; dz = dz. 
Logo: 
/ ex? de = / eTCtD(z4+1)dz = e! / e 2 +1)? dz, 
1 0 0 


portanto nas condições da fórmula de quadratura de Gauss-Laguerre. 


Como f(z) é um polinômio de grau 2, fazendo 2n + 1 = 2, obtemos que n = à > n = 1, desde que 
n indica o índice do último ponto a ser considerado e portanto deve ser um inteiro. Assim da Tabela 3, 
com N = 2, temos que: 


zo = 0,5857864, Ao = 0.8535534, 
zı = 34142136, Aı = 0.1464466 . 
Calculando f(z) = (z+ 1)? para zo e z1, obtemos: 


f(z) = 2.5147185 , 


fla) = 19.485282 . 
Logo: 
1 
XO Arf(Ek) = Aof (z0) + Af (21) = 4.9999998. 


k=0 
Portanto: = NS 
J a a) e™7(z+1)°dz = e™!(4.9999998) . 
1 0 


Observe que o resultado exato da integral é 5, A pequena diferença que existe entre o resultado exato 
e o valor obtido é devida aos erros de arredondamento. 


11.4.4 Fórmula de Gauss-Hermite 


Para utilizar a fórmula de Gauss-Hermite a integral a ser calculada deve ter a função peso w(x) = 
2 n . ~ ~ . “1: . 
e” :a=-oc e b= o. Neste caso se o intervalo de integração não coincidir com o intervalo [—o0, 00], 
não podemos utilizar a fórmula de Gauss-Hermite. Daremos a seguir exemplo. 


Exemplo 11.16 - Calcular, usando quadratura de Gauss, 


DO —q2 
e 
o: 3 q dz. 
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2 
Solução: Estamos nas condições da fórmula de Gauss-Hermite com f(x) = F- Assim, pela propriedade 
4, devemos tomar 2 pontos. Pela Tabela 4, com N = 2, temos que: 


to = —0.7071 , Ao = A = 0.8862 , 
zı = 0.7071. 
Assim: E 
—0.7071 
fa) = ET gos = fle). 
Portanto: 


i — x? de = 0.8662 x 2 x 0.25 = 0.4431. 


2 
Observe que neste exemplo consideramos f(x) = F, mas poderíamos ter colocado l fora da integral 


e considerado f(x) = x°. 


11.5 Erro nas Fórmulas de Gauss 


Quando f(x) é um polinômio, sabemos que as fórmulas de quadratura fornecem um resultado exato 
a menos, é claro, dos erros de arredondamento. 


Na maioria das situações reais, f(x) não é um polinômio e, portanto, sua integral é aproximada 
quando calculada através das fórmulas de quadratura. 


Exibiremos algumas expressões do termo do resto (ou erro de truncamento) para as várias fórmulas 
apresentadas. Não nos preocuparemos com a dedução de tais expressões por ser extremamente trabalhosa 
e sem nenhum interesse prático. 


Fórmula de Gauss-Legendre 


A expressão do erro, para a fórmula de Gauss-Legendre, é dada por: 


o 22"+8[(n + DI] PE 
En = marana O + E (md). 


Fórmula de Gauss-Tchebyshev 


A expressão do erro para a fórmula de Gauss-Tchebyshev é dada por: 


eo O a fred 


En = 
Formula de Gauss-Laguerre 


A expressão do erro, para a fórmula de Gauss-Laguerre, é dada por: 


[(n + 1)1? feet» (£) f E E (a,b) . 


Ea SoA 
(2n + 2)! 
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Fórmula de Gauss-Hermite 


A expressão do erro, para a fórmula de Gauss-Hermite, é dada por: 


n + Dq a 
Eae sa 1º 12 (E) , £e (a,b). 


Como pode ser observado, todas as fórmulas do erro contém a derivada da f de ordem 2n + 2, onde n 
é o Índice do último ponto considerado no cálculo da integral. Assim, usar a fórmula do erro para obter 
o número de pontos necessários para calcular a integral com uma determinada precisão torna-se inviável. 
Portanto, na prática, se quisermos o resultado da integral com uma determinada precisão, começamos 
calculando a integral com 2 pontos, vamos aumentando o número de pontos e comparando os resultados 
obtidos. Quando 2 resultados consecutivos tiverem o mesmo número de casas decimais iguais teremos o 
resultado com a precisão desejada. O próximo exemplo ilustra este fato. 


1.2 
f e” cos x dz, 
0 


com 3 casas decimais corretas, usando fórmula de quadratura de Gauss. 


Exemplo 11.17 - Calcular 


Solução: Como o intervalo de integração é finito, mas não cincide com o intervalo [—1,1], devemos fazer 
uma mudança de variável. Assim, 


Ë t 1 
O —1 1| = —2r + 12% + 12 = 0. 
1.2 1 1 
Logo: 
x = 0.6 (t+1) e dz = 0.6 dt. 
Assim: 


1.2 1 
/ e” cos z dr = 0.6 A e (+) cos (0.6 (t+1)) dt = 1, 
0 z 


e portanto estamos nas condições da fórmula de Gauss-Legendre com f(t) = e®6 (+1) cos (0.6 (t+ 1)). 
Fixemos n = 1. Pela Tabela 1, com N = 2, temos que: 


to = —0.5774, A = A = 10, 
tı = 0.5774. 
Agora: 
flto) = f(—0.5774) = e2536 cos(0.2536) = 1.2474 , 
f(ta) = f(0.5774) = e9464 cos(0.9464) = 1.5062. 
Portanto: 


I = 0.6 x (1.2474 + 1.5052) = 1.6522. 
Tomemos agora 3 pontos. Assim, pela Tabela 1, com N = 3, temos que: 


to —0.7746 , Ao = Á> = 0.5556, 


I 


ti = 0 , A 


I 


0.8889 , 


t2 


II 
> 
N 
N 
N 
D 
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Agora: 
flto) = f(-0.7746) = eº1852 cos(0.1352) = 1.1343 , 
f(t) = f(O) = e®6 cos(0.6) = 1.5038, 
f(t2) = f(0.7746) = el-9848 cos(1.0648) = 1.4058 . 
Portanto: 


I = 0.6 (x(1.1343 + 1.4058) x 0.5556 + 1.5038 x 0.8889)) = 1.6488 . 


Comparando o resultado obtido com n = 1 e n = 2, vemos que só temos uma casa decimal correta. 
Tomemos então n = 3. Assim, pela Tabela 1, com N = 4, temos que: 


to = —0.8611, A = A3 = 0.3479, 
tı = —0.3400, 4, = A = 0.6521, 
tə = 0.3400, 
tas = 0.8611. 
Agora: 
f(to) = f(-0.8611) = e?-08834 cos(0.08334) = 1.0831 , 
ft) = f(-0.3400) = e®™3%6 cos(0.396) = 1.3709 , 
f(t2) = f(0.3400) = e?8040 cos(0.8040) = 1.5503, 
f(ts) = f(0.8611) = et1167 cos(1.1167) = 1.3400 . 
Portanto: 
I = 0.6 x ( (1.0831 + 1.3400) x 0.3479 + (1.3709 + 1.5503) x 0.6521) 
= 1.6487. 


Comparando o resultado obtido com n = 2 e n = 3, vemos que temos três casas decimais iguais. 
Assim, temos obtido o resultado da integral com três casas decimais corretas. Observe que com este 
exemplo fica claro a superioridade das fórmulas de quadratura de Gauss, pois obtivemos a precisão 
desejada usando 3 pontos. Nos exemplos 11.2, 11.3 e 11.4 resolvemos esta integral, e para obter 3 casas 
decimais corretas usando as fórmulas de Simpson foram necessários 7 pontos e para a regra do trapézio 
seriam necessários 49 pontos, (ver exemplo 11.6). 


Exercícios: 


11.15 - Calcular 


1 
a) / (2 +22 +2+1) de, 


b) T (2—1) de, 


—2 


por quadratura de Gauss e diretamente e comparar os resultados. 
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11.16 - Usando quadratura de Gauss, calcular: 


E 1/2 
f =a r? dz. 


1 


11.17 - Calcular exatamente, a menos de erros de arredondamento, 


1 1 Tay 
da. 
1 (= a =] E 


11.18 - Usando quadratura de Gauss, calcular: 


com 2 casas decimais corretas. 


11.19 - Calcular: 


1 1/2 
1 1 
= d 
f (5 i zz) e 


com 2 casas decimais corretas, usando quadratura de Gauss. 


T 
fi cost 0 do, 
-r 
11.21 - Usando quadratura de Gauss, calcular: 


e (H) P 
a | edr, 
0 e 


exatamente, a menos de erros de arredondamento. 


11.20 - Calcular: 


usando a fórmula de Gauss-Tchebyshev. 


11.22 - Calcular: E 
ría) = f e" ql dz, paraa =5 , 
0 


usando quadratura de Gauss. 
Observação: I (a) é conhecida como função gama e vale, para a inteiro, T(a +1) = a! 


11.23 - Calcular: 


usando quadratura de Gauss sobre 4 pontos. 


11.24 - Calcular: 


usando quadratura de Gauss sobre 3 pontos. 


360 


CAPÍTULO 11. INTEGRAÇÃO NUMÉRICA 361 


11.6 Exercícios Complementares 


11.25 - Obtenha a fórmula de integração de Newton-Cotes do tipo fechado, para integrar f(x) com 
n=4, ou seja sobre 5 pontos. Usando a fórmula obtida, aproxime: 


3 
f x e? dz, 
2 


s | 2 225 25 275 30 
e3 |277 308 349 396 448 


sabendo que: 


11.26 - Calcule as integrais a seguir pela regra do trapézio e pelas regras l e 3 de Simpson usando 


6 divisões do intervalo de integração. Compare os resultados. 
2.5 0 
nf x lng dz, r f| ze dr. 
1 -1.5 


11.27 - Nas integrais do exercício anterior com quantas divisões do intervalo, podemos esperar obter 
erros menores que 107º? 


11.28 - Considere os seguintes dados experimentais: 


z | 1.0 1.2 14 16 18 20 22 24 26 28 30 
y(x) | 1.00 1.82 2.08 3.18 3.52 4.7 5.12 6.38 6.98 8.22 9.00 


encontre a área sob a curva y = y(x) usando: a regra 3 de Simpson de 1.0 a 2.2 e a regra l de Simpson 


de 2.2 a 3.0. 


11.29 - Considere a integral: 


1 
LE T mi dt = 0.45970. 
(0) 


mostre que o resultado obtido pela regra l de Simpson com h = 0.5 é surpreendente próximo do resultado 
exato. Explique porque isso acontece. (Sugestão: analise o erro). 


11.30 - Em contraste com o exercício anterior, considere: 


1 
T= da = 2.30259. 
01 T 


Usando a regra de Simpson sobre N intervalos obteve-se a tabela: 
N h I Erro 
2 0.45 3.3500 —1.0474 


4 0.225 2.2079 —0.1053 
8 0.1125 2.3206 —0.0180 


Explique a diferença entre estes resultados e o do exercício anterior. 


11.31 - Considere a função f(x) dada pela tabela: 


S NR E 
fe |[-1 5 1 5 3 
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a) Avalie: 


nf , f(x) da, 


usando a fórmula 5 de Simpson. 
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b) Se os valores tabelados são de um polinômio de grau 3 o que pode ser afirmado sobre o erro 


cometido na aproximação de I) pela fórmula l de Simpson? 
11.32 - Considere a integral: : 
f (2x? — 3x? + 1) dz . 
0 
Justifique o porquê da regra do trapézio com h = 1 ser exata para calcular tal integral. 


Sugestão: Verifique que para O < t < 0.5 vale: 
f(o.5 + t) — P(0.5 + t) = —(f(0.5 — t) — Pi (0.5 — t)) 
onde f(x) = 2z? — 3x? +1 e Pi(x) é a reta que interpola f(x) em xo =0 ex, =1. 
11.33 - Aproxime pela regra de Simpson o comprimento de arco da curva: 
y = 4r? — 3x 


de (0,0) a (1,1). 


Obs: Lembre que o comprimento de arco de uma curva (a, f(a)) a (b, f(b)) é dada por: 


b 
/ VIEW) de. 


11.34 - Uma maneira de se obter numericamente valores da função f(x) = lnx é calcular numerica- 


mente valores da integral 


mo = [ A 
1 t 


Calcular: 
i) In17, 
ii) ln35, 


com erro relativo inferior a 1074. 


11.35 - Escolha uma regra de quadratura sobre pontos igualmente espaçados de h e avalie: 


0 
/ q ef da, 
-1 


com duas casas decimais corretas. 


11.36 - Considere a integral: 
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a) Quantos intervalos seriam necessários para aproximar I usando a regra do trapézio, com erro 
inferior a 1072. 
b) Calcule I com o h obtido no item a). 


11.37 - Suponha que se conhece o valor de uma função f(x) através da seguinte tabela: 


UR | 1.0 1.2 14 17 2.0 2.3 2.65 3.0 
f(x) | 0.23 0.59 11 1.4 0.92 0.63 0.42 0.38 


Como você procederia para calcular: 


com a maior precisão possível? 


11.38 - Considere a integral: 


a) Determinar o número de intervalos suficientes para garantir o cálculo de I, com 4 casas 
decimais corretas, usando a regra de Simpson, nos seguintes casos: 


i) a=01, 
ii) 2=001, 
iii) «=0 


b) Obter I coma=o0, usando fórmula de quadratura de Gauss sobre 3 pontos. 


11.39 - Uma maneira de avaliar integrais da forma: 


NE e fo) de, 


é aproximar I, fazendo: 


k 
rar = | Fe) de, 


onde k é um inteiro escolhido de modo que, dado um valor ô > 0, vale |f (x)| < ô para todo x > k. 


Considere a integral: 
I = T(m) = J E pd, 
0 


a) Verificar que, para ô = 10! e m=3, para utilizarmos o procedimento acima devemos 


tomar k = 15. 
ii) Em quantos subintervalos devemos dividir o intervalo [0,15], para obter T* ~ T(3) com 


4 casas decimais corretas, usando a regra do trapézio? 


iii) Obter o valor exato de I = T(3), usando fórmula de quadratura de Gauss adequada. 


11.40 - Considere o problema: Calcular 


r= [ [rey dy dz. 


CAPÍTULO 11. INTEGRAÇÃO NUMÉRICA 364 


a) Verifique que a aplicação da regra do trapézio primeiramente na direção Oy e depois na 


direção Ox, fornece: 


[f (a,c) + f(b,c) + Fa, d) + f(b, d)] . 


b) Verifique que discretizando [a,b] e [c,d] respectivamente pelos pontos: 


xiza+ih, O<i<m, h= : 


y=a+gk, 0O<j<n, k = ; 


e então aplicando a regra do trapézio generalizada nas direções Oy e Ox, obtemos: 
hk mM n 
i=0 j=0 


onde: 


Qio =Gn=2, 1<i<m-l1; 
aoj =Imj=2, 1<j<n-l1; 


mj =t; I<i<xm-l, I<j<n-l. 


c) Usando a fórmula obtida em b), com h = 0.5 e k = 0.25, avalie: 
1 p0.5 
I yr? +y? dy de. 
o Jo 


11.41 - Considere a integral: 


I(a) = [ EC dz. 
0 


a) Obtenha I(1) com duas casas decimais corretas usando a regra de Simpson. 


b) Calcule exatamente, a menos de erros de arredondamento I(a),a — œ, usando fórmula de 


quadratura de Gauss. 


11.42 - Uma pessoa calculou: 
1 
ie i (3x? +22? +2) dr, 


—1 


usando a regra l de Simpson sobre os pontos: -1, 0, 1 e outra pessoa calculou I usando a fórmula de 
Gauss-Legendre sobre os pontos: - 0.51135, 0.57735. Qual das duas obteve melhor resultado? (Suponha 
que em ambos os casos não houve erros de arredondamento). 


11.43 - Deseja-se calcular: 
/ ei dt 
-2 V2=t V2+t 


Se você só pode obter o valor do integrando em 2 pontos, quais deverão ser estes pontos, de modo que 


a resposta seja a mais exata possível? 
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11.44 - Considere a tabela: 


s | o0 0.5 10 15 20 25 30 
fæ | —2 15 0.5 15 45 90 170 


Sabendo que a fórmula de quadratura: 


b 
1 f(x) dr = Af(w), a<w<b, 


é exata para polinômios de grau < 1, caclule A e w e use-os para aproximar: 


1 f(x) de. 


11.45 - Seja: 
2 
J Ho) do = Ao Ho) + 4 fa), 
—- 
onde £o = o Ends ta são os zeros do polinômio de grau 2 ortogonal em [—-1,2] segundo a 


função peso w(x) = 1. 
a) Calcule os coeficintes Ao e A tal que a fórmula seja exata para polinômios de grau < 3. 


b) Usando a fórmula de quadratura obtida em a), calcule: 
0 
d 
/ T de. 
—2 T + 3 
11.46 - Determine uma fórmula de quadratura para aproximar: 


/ ER 


que seja exata quando f(x) é um polinômio de grau < 3. Usando a fórmula obtida calcule: 


1 
1 (x4 +z sen x) dz. 
o 


11.47 - Considere a integral: 


1.6 
r= x” dz. 
0 


Obtenha o valor aproximado de I, com 2 dígitos significativos corretos: 
a) usando fórmula de Simpson. 
b) usando fórmula de quadratura de Gauss. 


Lembre-se que: liMmz—o 1” = 1. 
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11.7 Problemas Aplicados e Projetos 


11.1 - Um corpo negro (radiador perfeito) emite energia em uma taxa proporcional à quarta potência 
de sua temperatura absoluta, de acordo com a equação de Stefan-Boltzmann, 


E=369 102 T4, 
onde E = potência de emissão, W/cm? e T = temperatura, Kº. 
O que se deseja é determinar uma fração dessa energia contida no espectro visível, que é tomado aqui 


como sendo 4.107% a 7.1075 cm. Podemos obter a parte visível integrando a equação de Planck entre 
esses limites: 


7.1075 zii 

2.39 10 

Eyisível = [ 5(p1.432/T da , 
410-5 x5(e1432/Tz — 1) 


onde x = comprimento de onda, cm; E e T como definido acima. 


A eficiência luminosa é definida como a relação da energia no espectro visível para a energia total. 
Se multiplicarmos por 100 para obter a eficiência percentual e combinarmos as constantes, o problema 
torna-se o de calcular: 


TIOS de j 
EFF = | 64.77 Tn 
ls x5 (€1.482/Ta =) / 


Obter a eficiência luminosa, com erro relativo < 10º, nas seguintes condições: 
i) T; = 2000ºK 
T; = 3000 °K 
com incremento da temperatura igual a 250. 
ii) T; = 2000 °K 
T; = 3000 °K 
com incremento da temperatura igual a 200. 


onde T; e Ty são as temperaturas iniciais e finais, respectivamente. 


11.2 - De um velocímetro de um automóvel foram obtidos as seguintes leituras de velocidade ins- 
tantânea: 


(min) | 0 5 10 15 20 25 30 35 40 
vlkm/h) [23 25 30 35 40 45 47 52 60 


Calcule a distância em quilômetros, percorrida pelo automóvel usando a regra de Simpson. 


11.3 - 4 determinação da área da seção reta de rios e lagos é importante em projetos de prevenção de 
enchentes ( para o cálculo de vazão da água) e nos projetos de reservatórios ( para o cálculo do volume 
total de água). A menos que dispositivos tipo sonar sejam usados na obtenção do perfil do fundo de 
rios/lagos, o engenheiro civil deve trabalhar com valores da profundidade, obtidos em pontos discretos da 
superfície. Um exemplo típico de seção reta de um rio está mostrado na figura a seguir: 
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super ficie da água 


0“ 
2 
4 
ca Profundidade(m) 
Vl - 
0 10 20 


distância da margem esquerda(m) 
Use uma fórmula de quadratura sobre pontos igualmente espaçados de h, para calcular a área da seção 
reta da figura dada acima. 


11.4 - A equação de Clapeyron encontrada no estudo das relações de propriedade termodinâmica pode 
ser expressa como: 


da P AH, 
dT RT?’ 
onde P: pressão do vapor, T: temperatura absoluta, AH,: entalpia da vaporização, R: constante de gás. 
Esta temperatura, que é válida para um intervalo limitado de pressão e temperatura, pode ser usada 
para determinar a pressão de vapor em qualquer temperatura, reecrevendo-se e integrando a partir 
de alguma pressão e temperatura conhecidas Po, To. Mostre que fazendo isso obtemos: 


ri 
mé =f AH, p, (11.28) 
(o) 


A solução de requer o cálculo da integral indicada. Entretanto em muitos casos AH,, não pode 
ser dada por uma expressão analítica conveniente e a integral deve então ser calculada por um método 
numérico. 

Considere uma substância para a qual os seguintes dados são conhecidos: 


(11.27) 


T 185 190 195 200 205 210 
AH, 81.307 80.472 79.568 78.714 77.859 77.002 


215 220 225 230 235 
76.141 75.272 74.395 73.508 72.610 


R = 0.01614 K cal / Kg, Po = 0.028 atm em Ty = 185 ºK . 


Determine a pressão do vapor a uma temperatura de 235 ºK, usando 3, 5, 7, 9 e 11 pontos. Com 11 
pontos é possível dizer quantas casas decimais estão corretas? Se a resposta for afirmativa diga qual é a 
precisão obtida. 


Observe que nesse problema você não deve entrar com o valor de e, mas sim comparar os resultados 
obtidos. 


11.5 - Seja a viga em balanço e o carregamento dado na figura a seguir: 
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b = 0.20m FS Fá 


A 

A 

| 

l 

| 

| 

0.60m l 
a 


onde E = 200t/cm? (módulo de elasticidade do concreto). 


O deslocamento vertical no ponto B pode ser obtido através da expressão: 


B 
Mo M- 
ôvB = “dy , 

a EJ 
com 3 
1 bh 
Mo = -(- x}, M =£- = — 

(0) z r)“, 1 L T, J 12 , 
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onde Mo é o momento da viga, Mı é o momento da viga correspondente a uma carga unitária na direção 


e sentido do deslocamento e J é o momento de inércia de uma secção retangular de altura h. 


Determine o deslocamento vertical dv p com erro relativo inferior a 1074. 


11.6 - Na determinação da radiação luminosa emitida por um radiador perfeito é necessário calcular-se 


o valor da integral: 
Po Omo: 
Q= f e À, 
Mm AŠ(emaT — 1) 


onde: 


Q = radiação emitida por unidade de tempo por unidade de área entre os comprimentos de onda A 


e À», em erg/cm?.s, 


Àı e à2 = limites inferior e superior, respectivamente, do comprimento de onda, em cm, 


h = constante de Planck = 6.6256 x 1072” erg.s, 

c = velocidade da luz = 2.99793 x 1010 cm/s, 

k = constante de Boltzmann = 1.38054 x 10-18 erg/k, 
T = temperatura absoluta da superfície, °K, 

À = variável de integração = comprimento de onda, cm. 


Obter com erro relativo < 107º, nas seguintes condições: 
, , g ç 
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i) A = 3.933666 x 1075 cm , 
A» = 5.895923 x 1075 em , 
T = 2000°K . 


ii) A = 3.933666 x 10º cm , 
A» = 5.895923 x 1075 cm , 
T = 6000 °K 


11.7 - A função de Debye é encontrada em termodinâmica estatística no cálculo do calor específico da 
água a volume constante de certas substâncias. A função é expressa por: 


Do iya 
D(x) = 5S Y dr. 
0 


a ey —1 
Obter D(x), com erro relativo < 1072, nos seguintes casos: 
i) 2v=0.5 
ii) v=10 
iii) x= 50 
11.8 - Uma aproximação para a velocidade em função do tempo de um paraquedista em queda livre na 


atmosfera é dada pela equação: 
m E 
vt) = (Lent, 
c 


onde g é a aceleração da gravidade (9.8m/s2), m é a massa do paraquedista (68kg), c é o coeficiente de 
arrasto (12.5kg/s) et é o tempo (em s) a partir do ínicio da queda. Suponha que o paraquedista salte de 
uma altura de 3000m. Sabendo que o espaço percorrido pelo paraquedista entre os instantes de tempo a 
e b é dado por: 


b 
As Ed v(t) dt , 


calcule a altura em que se encontra o paraquedista nos instante t = 2s e t = 10s. Em ambos os casos, 
utilize a regra l de Simpson, com um número adequado de subintervalos para que o erro seja menor que 
Im. 


11.9 - O etileno ocupa a quinta posição entre os produtos químicos mais fabricados nos Estados Unidos 
e o primeiro lugar entre os produtos químicos orgânicos, ao longo de um ano. Mais de 28 milhões de 
libras foram produzidas em 1985 e vendidas a U $ 22/libra. De todo etileno produzido, 65% é usado na 
fabricação de plásticos, 20% para óxido de etileno e etileno glicol, 5% para fibras e 5% para solventes. 


Deseja-se determinar o tamanho (volume) de um reator necessário para produzir 300 milhões de 
libras de etileno por ano do craqueamento de etano puro. A reação é irreversível e elementar. Além 
disso, deseja-se alcançar 80% de conversão para o etano operando o reator isotermicamente a 1100K e 
à pressão de Gatm. A equação para o reator é dada por: 


? de 
pero [E 
no Ta 


onde: V é o volume do reator (ft); Fao é a taxa de alimentação do reagente (lb moles/s); —y4 éa 
taxa de reação (ftê/lb mol), e x é a conversão. A taxa de desaparecimento do etano (T4) é dada 
por: -T4 = kC , onde k é a constante de reação e C, a reconcentração do reagente (etano) é dada 
por: C = Co(1 — x)/(1 + €), com Co sendo a concentração inicial do reagente e e o fator de mudança de 
volume. Usando uma regra de quadratura sobre pontos igualmente espaçados de h, determine o volume 


de um reator, dado que: F4o = 0.425lb moles/s,k = 3.075 !,x = 0.8, Co = 0.00415lb moles/ ft? ee =1. 
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11.10 - 4 figura a seguir mostra um circuito típico contendo um amplificador. 


Muitos tipos de amplificadores são usados em instrumentos como transmissores de rádio e televisão, 
dispositivos de medidas, etc. Alguns tipos de amplificadores produzem correntes em pequeno pulso. Essa 
corrente é periódica no tempo, com T representando o período. 


Para analisar o circuito, é usualmente necessário expressar a corrente em termos de uma função 
analítica. Usando a série de Fourrier truncada em m termos para lp temos: 


2rt 4mt 
E) + Ia cos E 


I(t) = Io+h cos ( T ) 


2mzt — 2krt 
+ ...+ Im cos ( T) = 2 Iņ cos ca 


onde cada Ig é dado por: 


Suponha que em certo experimento você mediu a corrente I, em vários instantes de tempo e obteve a 
tabela a seguir: 


t(seg) | 0 1 2 3 4 5 6 7 8 9 10 
L(t) 100 94 80 6 31 0 -30 -58 -81 -95 -10l 


11 12 13 14 15 16 17 18 19 20 
96 82 —60 30 0 32 59 80 95 99 


a) Considerando T = 20, calcule: Io, ÅD, ..., T0. 


b) Desprezando os erros de arredondamento o que você pode concluir sobre a verdadeira ex- 
pressão da função para Ip(t)? 


11.11 - O serviço de proteção ao consumidor (SPC) tem recebido muitas reclamações quanto ao peso 
real do pacote de 5kg do açúcar vendido nos supermecados. Para verificar a validade das reclamações, 
o SPC contratou uma firma espacializada em estatística para fazer uma estimativa da quantidade de 
pacotes que realmente continham menos de 5kg. Como é inviável a repezagem de todos os pacotes, a 
firma responsável pesou apenas uma amostra de 100 pacotes. A partir destes dados e utilizando métodos 
estatísticos eles puderam ter uma boa idéia do peso de todos os pacotes existentes no mercado. 
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Chamando de x; o peso do pacote i, tem-se que a média da amostra © é dada por: 


n 
= 1 
z= -5 Li 
n A 
1=1 


onde n é o número de pacotes da amostra. Serão omitidos os pesos, face ao elevado número de pacotes 
examinados. 


Calculando-se a média: 


1 
T = = 499.1 = 4.991kg . 
T 100 x 499 991kg 


O desvio padrão que é uma medida estatística que dá uma noção da dispersão dos pesos em relação à 
média é dado por: 


n 


1 
= TZ 
S = + RE Tee zi). 


Para os dados deste problema tem-se que S = 0.005kg. 


Supondo-se verdadeira a hipótese de que a variação do peso dos pacotes não é tendenciosa, isto é, 
que o peso de um pacote é função de uma composição de efeitos de outras variáveis independentes, entre 
a quais podemos citar: regulagem da máquina de ensacar, variação da densidade do açúcar, leitura do 
peso, etc.; pode-se afirmar que a variável do peso tem uma distribuição normal. O gráfico da distribuição 
normal é apresentado a seguir: 


A forma analítica desta função é: 


1 1l/(2>—7) 
Ha) = a O) 


O valor de f(x) é a frequência de ocorrência do valor x. A integral de f(x) fornece a frequência 
acumulada, isto é: 


Pao) = f" Ha) do, 


é a probabilidade de que x assuma um valor menor ou igual a xo. Graficamente, F(xo) é a área hachurada 
na figura a seguir: 
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No problema em questão, o que se deseja é determinar : 


5 1 1 (7 — 4.991 ) E 
F(5) = Í —— — e2\ 0.005 dz . 
—oo 0.005 v27 
Observações: 
1) Riva f(x) dr = 1. 


2) A curva é simétrica em relação a média (©), logo: 


A fla) dz = i fla) de = 0.5. 


T 


11.12 -A definição da integral imprópria é: 
oo b 
pS / f(x) dz = 5m / f(x) dz. 


Se essa integral for convergente podemos avaliá-la aproximadamente por método numérico. Por exem- 
plo, a integral exponencial Ei(x) pode ser avaliada tomando o limite superior U suficientemente grande 
em: 


Sabemos que U é “suficientemente grande” quando as contribuições adicionais ao fazer U maior são 
desprezíveis. Estimar EI (0.5) . 


Note que pode-se usar subintervalos maiores a medida que v cresce. Compare o valor obtido com o 
valor tabular: 0.5598. 


11.13 - A seção reta de um veleiro está mostrada na figura a seguir: 
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— z2=10m 
cabos de 
suporte 
vento 
mastro =» 
— 
— 
o 
1 z=0 


A força que o vento exerce sobre o mastro (devido às velas), varia conforme a altura z ( em metros) 
a partir do convés. Medidas experimentais constataram que a força resultante exercida sobre o mastro 
(em N) é dada pela equação: 


10 


F=] Jd I= y 


zZ —2z 
e 10 , 


Deseja-se saber a linha de ação de F, isto é, o ponto onde pode-se aplicar uma força de mesmo módulo, 
direção e sentido de F, tal que o efeito sobre o mastro seja o mesmo de F. Esse ponto, localizado a uma 
altura d do convés do barco, pode ser determinado a partir da seguinte equação: 


ho z fo) dz 
Jo FO) dz 


Pede-se então calcular o valor de d, usando fórmula de quadratura sobre pontos igualmente espaçados 


de h. 


11.14 - Suponha que a água em uma represa exerce uma pressão sobre a face esquerda da mesma, como 
mostrada na figura: 


VA 

piteni 200 
x 190 
40 — 175 
4] 160 
20 — 135 
| = 2 130 
0 52727777 y 122 

(a (b) 


Essa pressão pode ser caracterizada pela expressão: 


p(z) = pg(D-2), 
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onde p(z) é a pressão (em N/m?) na altura z (em m) a partir do fundo do represa. A densidade da 
água p é suposta constante e vale 102 kg/m, a aceleração da gravidade vale 9.8m/s2, e D é a altura 
(em m) da superfície da água a partir do fundo do represa. Sabe-se que a pressão aumenta linearmente 
com a profundidade, como mostrado em (a). A força total fı sobre a face esquerda da represa pode ser 
calculada multiplicando-se a pressão pela área da face da represa. A largura da represa para diferentes 
profundidades, está mostrada em (b). Assuma que a largura da represa varia linearmente desde 200m ( 
na superfície) até 122m (a 60 m de profundidade). 


Assim a força resultante sobre a face da represa pode ser obtida através de: 


D 
fi = f p g w(z) (D — z) dz, 


onde w(z) é a largura da represa na altura z a partir do fundo. Determine a altura d da linha de ação 
da força resultante, que pode ser obtida através do cálculo de: 


J zp gwl) (D-2) 
f: 


d = dz. 
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TABELA 1 


Ji Ha)do 


Ti 


0.5773502691 


0.7745966692 
0.0000000000 


0.8611363115 
0.3399810435 


0.9061798459 
0.5384693101 
0.0000000000 


0.9324695142 
0.6612093864 
0.2386191860 


0.9491079123 
0.7415311855 
0.4058451513 
0.0000000000 


0.9602898564 
0.7966664774 
0.5255324099 
0.1834346424 


A; 


(1)0.1000000000 


0.5555555555 
0.8888888888 


0.3478548451 
0.6521451548 


0.2369268850 
0.4786286704 
0.5688888888 


0.1713244923 
0.3607615730 
0.4679139345 


0.1294849661 
0.2797053914 
0.3818300505 
0.4179591836 


0.1012285362 
0.2223810344 
0.3137066458 
0.3626837833 
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TABELA 2 fi; (1-2) faz 


a = —1/2 
N = 2 
0.7071067811 (1)0.1570796326 
N=3 
0.8660254037 (1)0.1047197551 
0.0000000000 (1)0.1047197551 
N 


0.9238795325 
0.3826834323 


0.9510565162 
0.5877852522 
0.0000000000 


0.7853981633 
0.7853981633 


0.6283185307 
0.6283185307 
0.6283185307 


N 
0.9659258262 0.5235987755 
0.7071067811 0.5235987755 
0.2588190451 0.5235987755 
N 
0.9749279121 0.4487989505 
0.7818314824 0.4487989505 
0.4338837391 0.4487989505 
0.0000000000 0.4487989505 


0.9807852804 
0.8314696123 
0.5555702330 
0.1950903220 


0.3926990816 
0.3926990816 
0.3926990816 
0.3926990812 
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TABELA 3 fo ce E P(ado 


Ti 


0.5857864376 
(1)0.3414213562 


0.4157745567 
(1)0.2294280360 
(1)0.6289945082 


0.3225476896 
(1)0.1745761101 
(1)0.4536620296 
(1)0.9395070912 


0.2635603197 
(1)0.1413403059 
(1)0.3596425771 
(1)0.7085810005 
(2)0.1264080084 

0.2228466041 
(1)0.1188932101 
(1)0.2992736326 
(1)0.5775143569 
(1)0.9837467418 
(2)0.1598297398 


Ai 


0.8535533905 
0.1464466094 


0.7110930099 
0.2785177335 
(-1)0.1038925650 


0.6031541043 

0.3574186924 
(-1)0.3888790851 
(-3)0.5392947055 


0.5217556105 

0.3986668110 
(-1)0.7594244968 
(-2)0.3611758679 
(-4)0.2336997238 


0.4589646739 
0.4170008307 
0.1133733820 

(-1)0.1039919745 

(-3)0.2610172028 

(-6)0.8985479064 
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TABELA 4 


Ti 


0.7071067811 


(1)0.1224744871 
0.0000000000 


(1)0.1650680123 
0.5246476323 


(1)0.2020182870 
0.9585724646 
0.0000000000 


(1)0.2350604973 
(1)0.1335849074 
0.4360774119 


(1)0.2651961356 
(1)0.1673551628 
0.8162878828 
0.0000000000 


(1)0.2930637420 
(1)0.1981656756 
(1)0.1157193712 

0.3811869902 


Ai 


0.8862269254 


0.2954089751 
(1)0.1181635900 


(-1)0.8131283544 
0.8049140900 


(-1)0.1995324205 
0.3936193231 
0.6453087204 


(-2)0.4530009905 
0.1570673203 
0.7246295952 


(-3)0.9717812450 
(-1)0.5451558281 
0.4256072526 
0.8102646175 


(-3)0.1996040722 
(-1)0.1707798300 
0.2078023258 
0.6611470125 
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Capítulo 12 


Solução Numérica de Equações 
Diferenciais Ordinárias 


12.1 Introdução 


Muitos problemas encontrados em engenharia e outras ciências podem ser formulados em termos de 
equações diferenciais. Por exemplo, trajetórias balísticas, teoria dos satélites artificiais, estudo de redes 
elétricas, curvaturas de vigas, estabilidade de aviões, teoria das vibrações, reações químicas e outras 
aplicações estão relacionadas com equações diferenciais. O objetivo deste capítulo é apresentar uma 
introdução à resolução de equações diferenciais ordinárias através de métodos numéricos. 

A equação: 

y e f(x,y) , (12.1) 


é chamada Equação Diferencial de primeira ordem. Nesta equação f é uma função real dada, de 
duas variáveis reais z e y, e y é uma função incógnita da variável independente x. Além disso, y e f podem 
ser vetores, caso em que teremos um sistema de equações diferenciais de primeira ordem. Trataremos 
inicialmente apenas o caso escalar. 

Resolver corresponde a se determinar uma função y = y(x), diferenciável, com z € [a,b] tal que 
y'(x) = f(x, y(x)). Qualquer função que satisfaça essa propriedade é uma solução da equação diferencial 
(12.1). Por exemplo, a função y(x) = Ce” é, para qualquer valor da constante C, uma solução da 
equação diferencial y’ = y. Assim, cada equação diferencial de primeira ordem possui um número infinito 
de soluções. Contudo, podemos selecionar uma solução particular, se junto com a equação diferencial for 
dado o valor da solução y(x) em um ponto, por exemplo, y(xo) = yo (chamada condição inicial). Se para 
a equação diferencial: y’ = y é dado que y(0) = 1 então obtemos C = 1 e assim a solução do (p.v.i.) é 
ylz) = e. 

A equação diferencial juntamente com a condição inicial constituem um problema de valor inicial, 
(p.v.i), isto é: 

y = f(x,y) 
(12.2) 
y(zo) = Yo 


O seguinte teorema, estabelece condições sobre a f(x,y) as quais garantem a existência de uma única 


solução do (p.v.i) (12.2). 
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Teorema 12.1 - Existência e Unicidade - Seja f(x,y) definida e contínua em D = f(x,y) /a< 
z < b; =œ <y < oo; aeb finitos} . Suponhamos que existe constante L > 0 tal que 


f(x,y) B Fx, y*)| £ Ly — y*| $ V(x, y) , (x, y”) E Da 


Então, se yo é um número dado, existe uma única solução y(x) do (p.v.i.) (12.2), onde y(x) é 
contínua e diferenciável para todo (x,y) € D. 


Prova: A prova deste teorema pode ser encontrada em [Henrice, 1962]. 


A grande maioria das equações encontradas na prática não podem ser solucionadas analiticamente; 
o recurso de que dispomos é o emprego de métodos numéricos. Para todos os métodos descritos neste 
capítulo consideraremos o (p.v.i.) com a hipótese que f satisfaz as condições do Teorema (12.1), 
o qual garante que o problema tem uma única solução continuamente diferenciável, a qual indicaremos 
por y(x). Também consideraremos a sequência de pontos {xn} definida por: 


Zn = To +nh ; n=0,1,.... N, 


onde zo =a, £y =b, e N = b-a 

Dizemos que o comprimento do intervalo, h, é o tamanho do passo, os pontos x, são os pontos 
da malha e N é o número de passos. 

Uma propriedade importante dos métodos computacionais para a solução de é a discretização, 
isto é, desejamos obter a solução aproximada do (p.v.i.) não num intervalo contínuo a < x < b, mas sim 
num conjunto discreto de pontos fx, / n =0,1,..., N} 

Denotaremos por: yn uma aproximação para a solução teórica em x,, isto é: Yn = y(zn) e por 
fn = F(En, Yn). 

Nosso objetivo é então determinarmos aproximações yn da solução verdadeira y(£n) nos pontos da 
malha. Portanto a solução numérica será uma tabela de valores dos pares (£n, Yn), Yn E y(Ln). 

Veremos a seguir alguns métodos para solução numérica de (12.2). 


12.2 Método de Taylor de Ordem q 


O primeiro método que discutiremos não é exatamente um método numérico, mas é algumas vezes 
usado em combinação com esquemas numéricos; é de aplicabilidade quase que geral, e servirá como 
introdução para outras técnicas que estudaremos. 

Consideremos o (p.v.i.) (12.2). A função f pode ser linear ou não, mas vamos admitir que f seja 
contínua e suficientemente derivável em relação a x e y. Seja y(x) é a solução exata de (12.2). A expansão 
em série de Taylor para y(xn + h) em torno do ponto £n, é dada por: 


Ylan +h) = yltn)+ hy'(zn)+ hy (En) Fe. 
(12.3) 


ha q+1 
T Bry (2n) + Ermu (En) » In<En<Inth, 


onde o último termo é o erro de truncamento local. 

As derivadas na expansão não são conhecidas explicitamente, uma vez que a solução exata 
não é conhecida. Contudo, se f é suficientemente derivável, elas podem ser obtidas considerando-se a 
derivada total de y’ = f(x,y) com respeito a x, tendo em mente que f é uma função implícita de y. 
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Assim sendo, obtemos para as primeira derivadas: 


y = Hay), 

y = f= FEE hth, 

m n ofr dy , of. [of d 
dali add 


qu (12.4) 


II 
z 
8 


+ fey Í + fyz f + fuut? + fyfa + fy f 


Continuando desta maneira, podemos expressar qualquer derivada de y em termos de f(x,y) e de 
suas derivadas parciais. Contudo, é claro que, a menos que f(x,y) seja uma função muito simples, as 
derivadas totais de ordem mais elevada tornam-se cada vez mais complexas. Por age Práticas deve-se, 
então, limitar o número de termos na expansão (12.3). Truncando então a expansão , após (q + 1) 
termos; obtemos: 

h? e(a-1) 
y(n +h) = y(n) +h fan ylzn) +... + q f (En, Yy(£n)) . 

Esta equação pode ser interpretada como uma relação aproximada entre valores exatos da solução de 
(12.2). Uma relação exata entre valores aproximados da solução de (12.2) pode ser obtida substituindo-se 
Y(En) por Yn e fP (£n, y(zn)) por fP:j= =0,1,...,q— 1. Fazendo isso, obtemos: 

Ne y ha 


| | (4-1). 


Yn+1 = Yn +h fn H 


que é chamado Método de Taylor de ordem q. 
Exemplo 12.1 - Resolver o (p.v.i): 


y = -y+tr+2 ; 


y(0) = 2 0<xz<0.3 
usando o método de Taylor de ordem 3. 
Solução: Temos que o método de Taylor de ordem 3 é dado por , com q = 3, isto é: 


h2 S h3 
Yn41 = Yn th fn 2 fa + 3] 


Pa (12.6) 
Desde que f = —y + x + 2, obtemos: 


F = 1+(-1)(-y+s+2) = y-r-1, 


f = —1 + (1)(-y +z +2) = -y+ +1. 
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Fazendo n = 0 em (12.6), obtemos: 


h2 h3 
yı = wthfo+s fot o 


Observe que para calcular y devemos avaliar f e suas derivadas em (zo, yọ). Temos que o intervalo, 
onde desejamos obter a solução do (p.v.i.), é [0,0.3] e yo = 2. Assim (xo, yo) = (0,2). Logo: 


fo = F(xo,yo) = f(0,2) = —-2+0+2=0, 
fo = f'(zo,yo) = f'(0,2)=2-0-1=1, 
o = f"(£o,yo)= f" (0,2) = -2+0+1=-1. 
Portanto: 
0.1)? 0.1) 
yı = 2 + 0.1(0)+ oija ( (—1) 
= 2.0048 ~ y(xı) = y(0.1). 
Fazendo agora n = 1 em (12.6), obtemos: 
h? h? 
y2 = yth fi TE 7 E 


Assim para calcular y2 devemos avaliar a f e suas derivadas em (z1, y1). Temos que h = 0.1 > 
(x1,y1) = (0.1, 2.0048). Portanto: 


fi = fam) = f(0-1, 2.0048) = —2.0048 + 0.1 + 2 = 0.0952 , 
fl = f(x) = F'(0.1, 2.0048) = 2.0048 — (0.1) — 1 = 0.9048 , 
" = f"(æ1,y1) = f” (0.1, 2.0048) = —2.0048 + 0.1 + 1 = —0.9048 . 
Logo: 
0.1)? 0.1)’ 
y2 = 2.0048 + 0.1(0.0952) + 4 > (0.9048) + £ F (—0.9048) 
= 2.0186 >œ y(x2) = y(0.2). 
Finalmente, fazendo n = 2 em (12.6), obtemos: 
h? f h? M 
ys = y+h fz24 z J27 3p 22 
Temos que (x2, y2) = (0.2, 2.0186). Assim: 
b = f(£2,y2) = f(0.2, 1.9603) = —2.0186 + 0.2 + 2 = 0.1814 , 
f} = f(x,y) = F'(0.2, 1.9603) = 2.0186 — 0.2 — 1 = 0.8186 , 


u = f"(x2,y2) = f” (0.2, 1.9603) = —2.0186 + 0.2 + 1 = —0.8186 . 
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Portanto: 


0.1)? 0.1)3 
y3 = 2.0186 + 0.1(0.1814) + CD (9,8186) +e ie) 


= 2.0406 œ y(x3) = y(0.3). 


Assim a solução do (p.v.i.) dado é: 


Tn Yn Y(Tn) 
0 2 2 


0.1 | 2.0048 | 2.00484 


0.2 | 2.0186 | 2.01873 


0.3 | 2.0406 | 2.04082 


onde a última coluna foi obtida através da solução exata do (p.v.i.) que é: y(x) =e? +ar+1. 


Observe que nem sempre podemos aplicar o método de Taylor de ordem q, com q qualquer, como 
pode ser observado no próximo exemplo. 


Exemplo 12.2 - Resolver o (p.v.i): 


usando o método de Taylor de ordem 3. 


Solução: Temos que o método de Taylor de ordem 3 é dado por (12.6). Inicialmente calculamos as 
derivadas da f. Temos que: 


Observe que a derivada segunda de y não existe, desde que yo = 0. Assim, só podemos utilizar o 
método de Taylor com q = 1. 


Assim as desvantagens do método de Taylor de ordem q são: calcular as derivadas da f e a cada passo 
avaliá-las nos pontos (£n, Yn), € o fato de nem sempre podermos utilizar o método com q qualquer. 


12.3 Métodos Lineares de Passo Múltiplo 


Inicialmente, para resolver o (p.v.i.) (12.2), descreveremos os Métodos Lineares de Passo 
Múltiplo ou Métodos de k-passos. 
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Definição 12.1 - Um método linear de passo múltiplo é definido pela seguinte relação: 
k k 
5 Qj Yn+j = h 5 bj Jng , (12.7) 
j=0 j=0 


onde a; e B; são constantes arbitrárias independentes de n, com a; £ 0 e ao e Bo não ambos nulos. 
Vamos supor ay = 1. 


Dizemos que o método (12.7) é explícito se 8 = 0 e implícito se p £ 0. 


Os métodos de passo múltiplo podem ser obtidos de várias maneiras. Veremos a seguir algumas 
técnicas de como obter tais métodos . 


12.3.1 Obtidos do Desenvolvimento de Taylor 


Descreveremos aqui como obter métodos lineares de passo múltiplo para resolver (12.2), baseados no 
desenvonvimento da solução exata do (p.v.i.) em série de Taylor. Novamente, a função f pode ser linear 
ou não, mas vamos admitir que f seja contínua e suficientemente derivável em relação a x e y. 


I) O método mais simples de passo múltiplo é obtido fazendo q = 1, no método de Taylor de ordem q, 
fórmula (12.5). Obtemos então o método explícito de 1-passo: 


mt = Un th fn, (12.8) 
chamado Método de Euler. 
Exemplo 12.3 - Usando o método de Euler, resolver o (p.v.i.) do exemplo 
Solução: Fazendo n = 0, em (12.8), obtemos: 
yı =Yyo +h fo=2 + 01(0)=2 = y(zı) = y(0.1), 
onde fo foi calculada no exemplo [12.1] Fazendo agora n = 1, em (12.8), segue que: 
y2 = yı + hfı = 2 +0.1(0.1) = 2.01 = yo) = y(0.2), 


desde que fı = f(x1, y1) = f(0.1,2) = —2+0.1+2 = 0.1. Finalmente, fazendo n = 2 em (12.8), obtemos: 


Y3 = y2 + h f2 = 2.01 + 0.1(0.19) = 2.019 =y(x3) = y(0.3), 


desde que fo = f(x2,y2) = f(0.2,2.01) = —2.01 + 0.2 + 2 = 0.19. 


Assim a solução do (p.v.i.) dado é: 


an| m 
0 2 
0.1 2 
0.2 | 2.01 
0.3 | 2.019 
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Compare os resultados obtidos com os do exemplo Como pode ser observado os resultados 
obtidos pelo método de Euler não são de boa qualidade. Em geral, o método de Euler tem, na verdade, 
mais importância teórica do que prática. E necessário então estabelecermos métodos mais precisos. 


II) Considere agora o desenvolvimento de y(x, + h) e y(£n — h) em série de Taylor em torno do ponto 
£n, isto é: 


2 3 
Y(En +h) = (zm) + hy'(8n) + Bry @n) + Bryan) +... 


3 
YlEn =h) = (rn) — hy (2n) + rY” (En) — gry” (En) t... 
Calculando y(£n +h) — y(£n — h), obtemos: 


h3 
Win +h) — y(n =h) = 2hy'(2n) + y" (En)... 


Considerando apenas o primeiro termo do lado direito da expansão acima, substituindo y(£n +h) por 
Yn+1, YLEn — h) por yn-1 ey (xn) por fn, obtemos: 
Yn+1 — Yn-1ı = 2hfn. 
Esta fórmula pode ser colocada na forma trocando n por n + 1. Fazendo isso, obtemos que: 
Yn+2 = Yn + 2hfn+ı, (12.9) 


que é um método explícito de 2-passos chamado Regra do Ponto Médio. 


Observe que para resolver um (p.v.i.) usando um método explícito de 2-passos, como é o caso da 
regra do ponto médio, devemos ter disponíveis além do valor de yo, o valor de yı. Assim, o valor de yı 
deve ser obtido de alguma outra forma, por exemplo, usando método numérico de 1-passo. 


Exemplo 12.4 - Resolver o (p.v.i.) do exemplo através da regra do ponto médio. Use o método 
de Taylor de ordem 2, para obter os valores iniciais necessários. 


Solução: Temos que: o valor de yo é dado no (p.v.i.) e para calcular y1, usaremos o método de Taylor 
de ordem 2, o qual é dado por (12.5), com q = 2, isto é: 


h2 
Yn+1 = mth nt Ín . 
Os valores de fo e de fé já foram calculados no exemplo Assim: 
(0.1)? 
yı = 2+ (0.1)(0) + (1) = 2.0050 ~ y(rı) = y(0.1) . 


Agora fı = f(x1,1n) = f (0.1, 2.0050) = —2.0050 + 0.1 + 2 = 0.0950. 


Assim, fazendo n = 0, em (12.9), obtemos que: 
y2=yo + 2hfi=2 + 2(0.1)(0.0950) = 2.0190 = y(£2) = y(0.2) . 
Finalmente, desde que fo = f (£2, y2) = f (0.2, 2.0190) = —2.0190+0.2+2 = 0.1810, obtemos, fazendo 


n = 1, em (12.9), que: 


y3 = yı + 2hf2 = 2.0050 + 2(0.1)(0.1810) = 2.0412 = y(z3) = y(0.3) . 


Assim a solução do (p.v.i.) dado é: 
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En) Mm 
0/2 

0.1 | 2.0050 

0.2 | 2.0190 

0.3 | 2.0412 


Observe que o resultado aqui é mais preciso do que o obtido pelo método de Euler. 


12.3.2 Obtidos de Integração Numérica 
Descreveremos aqui como obter métodos lineares de passo múltiplo para resolver o (p.v.i.), (12.2), 


obtidos a partir de fórmulas de integração numérica. 


Integrando a equação diferencial de primeira ordem, do (p.v.i.) (12.2), de £n até «nx, obtemos: 


/ e E f TE a (12.10) 


n n 


Agora, desde que o lado esquerdo de (12.10) pode ser integrado exatamente, obtemos que a solução 
exata de (12.2) satisfaz a identidade: 
Ln +k 
name) = ulen) = | Hæv) de, (12.11) 


Tn 


para quaisquer dois pontos £n € £n+k em [a,b]. Assim, para diferentes valores de k, após aproximar a 
integral do lado direito de (12.11), obtemos diferentes métodos lineares de passo múltiplo. De fato: 


I) Fazendo k = 1 em (12.11), obtemos: 
Tn+1 
Wena) ul) = [O Foya) de, 


Tn 


e assim podemos aplicar a regra do trapézio, fórmula (11.6), para calcular a integral, na expressão acima 
desde que a mesma está sendo avaliada entre dois pontos consecutivos. Fazendo isso, segue que: 


Hen) = 20) + È UHem (ea) + Hen lena) 


Substituindo y(xn) e y(£n+1) POr Yn € Yn+1, respectivamente, obtemos: 
h 
Yn+1ı = Yn + z [fn + fas] 3 (12.12) 
que é um método implícito de 1-passo chamado método do trapézio. 
Observe que, (12.12) é uma equação implícita para yn+1, uma vez que yn+1 aparece como argumento 
no segundo membro. Se f(x,y) for uma função não linear, não teremos, em geral, condições de resolver 


(12.12) em relação a yn+ı de uma forma exata. Assim métodos implícitos serão usados nos métodos do 
tipo Previsor-Corretor que serão descritos mais adiante. 
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II) Fazendo k = 2 em (12.11), obtemos: 


Tn+2 


E T = / fa, v(a)) de , 


Tn 
e assim podemos aplicar a regra l de Simpson, fórmula (11.9), para calcular a integral na expressão 


acima desde que a mesma está sendo avaliada entre três pontos consecutivos. Fazendo isso, segue que: 


Y(En+2) = Ulm) + K [SEn Y(En)) + 4f (n41, Y(En41)) + F(En4+2, Y(En+2))] > 


e como no caso anterior, obtemos: 


h 
Yn+2 = Ynd 3 EM H4fn+1 d fno] , (12.13) 


que é um método implícito de 2-passos chamado método de Simpson. 


Observe que para poder aplicar o método (12.13), precisamos além de utilizar métodos do tipo 
Previsor-Corretor, também obter valores iniciais por métodos de 1-passo. 


Além de aproximar a integral do lado direito de (12.11), usando as fórmulas de Newton-Cotes do tipo 
fechado, dadas no Capítulo 11, podemos também obter métodos de k-passos, baseados em fórmulas de 
integração numérica, usando as fórmulas de Newton-Cotes do tipo aberto, como veremos a seguir. 

HI) Seja P(x) o único polinômio de grau 2 passando pelos pontos: 


(Das Ta) , Cais fai) , (En+2; fn+2) E 


Usando a forma de Newton-Gregory para o polinômio de interpolação, fórmula (10.32), obtemos: 


A? 
P(a) = fa + (2 8n)Afa + (2- 2n) tn) SE 
Agora, desde que os pontos zi, i = n,n + 1,n + 2 são igualmente espaçados de h, podemos fazer a 
seguinte mudança de variável: u = & 7%, e assim: 


P(x) = P(ta + uh) = fh + u Afh + 


u(u — 1) 
E a 


Integrando a equação diferencial de primeira ordem, do (p.v.i.) (12.2), de £n+1 até £n+2, substituindo 
Y(En+2) € y(Ln+1) POr Yn+2 € Yn+1, respectivamente, e usando o fato que: 


pq f(x, y(£)) de S E P(x) de = JA P(n + uh) h du , 


n+l Tn+1 


obtemos: 


2 
Yn+2 — Yn+y1 = nf [+ + uA fn + 
1 
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Agora, pela fórmula (10.31), temos que as diferenças ordinárias de ordens 1 e 2, são dadas, respecti- 
vamente, por: 


A fn = Jfn+1— În , 


A? fa = fn42 — 2fn41 + fn - 


Assim, substituindo as diferenças ordinárias na expressão acima e agrupando os termos semelhantes, 
segue que: 


h 
Yn+2 = Ynti 75 [-fn +8 fn+1 +5fn+2] , (12.14) 


que é um método implícito de 2-passos chamado Método de Adams-Moulton. Vale aqui a mesma 
observação dada no método de Simpson. 


IV) De maneira semelhante ao método anterior, se aproximarmos f(x, y(x)) por um polinômio de inter- 
polação sobre os pontos (£n, fn) , (En+1, fn+1), isto é, por um polinômio do primeiro grau, e integrarmos 
a equação diferencial de primeira ordem, do (p.v.i.) (12.2), de £n+1ı até £n+2, obtemos: 


h 
Yn+2 = Yn+1 + 2 |- fn + 3 fa] , (12.15) 


que é um método explícito de 2-passos chamado Método de Adams-Bashforth. Como na regra do 
ponto médio, para aplicar este método devemos obter, inicialmente, o valor de yı por método de 1-passo. 


Exemplo 12.5 - Resolver o (p.v.i.) do exemplo usando o método de Adams-Bashforth. Use o 


método de Taylor de ordem 2, para obter os valores iniciais necessários. 


Solução: Temos que: yo = 2 (condição inicial), fo = 0 e yı = 2.005, fı = 0.095) ( calculado no exemplo 


12.4). Assim, fazendo n = 0 em (12.15), segue que: 


h 1 
y2 = y+ 5l-fo+ 3h] = 2.005 + 5 [-0 + 3(0.095)] 


= 2.0193= y(x2) = y(0.2) . 


Agora f(xo,y2) = f(0.2,2.0193) = —2.0193 + 0.2 + 2 = 0.1807. Assim, fazendo n = 1 em (12.15), 
obtemos: 


h 1 
Y3 = Yt zl + 3 f2] = 2.0193 + 910.095 + 3(0.1807)] 


= 2.0417 ~ y(z3) = y(0.3) . 


Assim a solução do (p.v.i.) dado é: 


Tn Yn 
0 2 
0.1 | 2.005 
0.2 | 2.0193 
0.3 | 2.0417 
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Observe que todos os métodos de passo múltiplo obtidos via integração numérica satisfazem: 
ak=l, a;=-1 e q=0,:=0,1,...,,)-1,j+1,...,k-—1. 
Existem outras maneiras de se obter métodos lineares de passo múltiplo, entretanto julgamos que os 


métodos aqui apresentados dão uma boa idéia ao leitor do que sejam tais métodos e como podem ser 
aplicados. 


Exercícios 
12.1 - Mostre que, fazendo k = 3 em (12.11), e usando a fórmula , obtem-se: 


3h 
Yn+3 = Yn +g n + 3( fnri + fat2) + fats] , 


que é um método implícito de 3-passos chamado método 3 de Simpson. 


12.2 - Considere os seguintes problemas de valor inicial: 


y' = y’ +1 

a) 
y(0) = 0 ; 0<zr<1 ; h= 0.2 
y = —2ry ; 

b) 
y(0) = 1 Esso ; h = 03 
y = ey ; 


c) 


Resolva-os pelo: 
a) método de Euler, 
b) método de Taylor de ordem 2, 
c) regra do ponto médio, 


d) método de Adams-Bashforth, 


usando para os itens c) e d), o item b) para obter os valores iniciais necessários, 


12.3.3 Ordem e Constante do Erro 


Analisaremos aqui a Ordem e a Constante do Erro, para os métodos lineares de passo múltiplo 


definidos por (12.7). 
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Definição 12.2 - Definimos o operador diferença linear L, associado ao método linear de passo 
múltiplo (12.7, por: 


k 
= X` [ajylz+jh) — Ay (e + jh)] , (12.16) 
j=0 


onde y(x) é uma função arbitrária continuamente diferenciável em [a, b]. 


Expandindo y(x + jh) e y'(x+jh) em série de Taylor em torno do ponto x, desenvolvendo o somatório 
e agrupando os termos semelhantes, obtemos: 


Lly(ae);h] = Coyle) + Cihy' (£) +... FC Hhy Ma) +... , (12.17) 
onde 
Co = aogta+...+ar, 
C = ai +2az2 +... + kak — (bo + Bi +... + Be), (12.18) 
C, = Šar tot... tko) — qlb tA Aa.. t EG) 
g += q! Q1 + OD [ua 3o Qk Q- 1)! 1 2 ape k)» 


Definição 12.3 - O operador diferença (12.16) e o método linear de passo múltiplo associado (12.7, 
têm ordem q, se em , Co = C1 =... = Cq = 0 e Cgi Æ 0. Cy é chamada de constante do 
erro. 


Exemplo 12.6 - Obter a ordem e a constante do erro para: 
a) o método de Euler, 


b) a regra do trapézio. 


Solução: Temos que o método de Euler é dado por (|12.8), de onde deduzimos que: 


ag = —1 , Bo = l, 
Q = 1 , Bi = 0. 
Assim: 
Co aorta > C=-1+1=0, 
Cı — (bo +61) > CG=1-(1+0)=0, 
1 1 1 
C2 atoa) — (81) > Co= 50) -(0)=5. 
Logo, Co = C1 = 0 e C2 Æ 0. Portanto a ordem do método de Euler é q = 1 e a constante do erro é 
I 
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O método do trapézio é dado por (12.12). Assim: 


ao =, Bo = F 
a = 1, Bi = b; 
Portanto: 
Co = ota > C=-1+1=0, 
1 1 
C = e 
1 1 
C2 = — Bi > C= 37 z350. 
Qı 6i a 1 1 
a= a e a 


Logo, Co = C1 = C2 = 0 e C3 Æ 0. Portanto a ordem do método do trapézio é q = 2 e a constante do 
erro é C3 = +. 


Exercício 


12.3 - Determinar a ordem e a constante do erro para: 
a) regra do ponto médio, 

b) método de Simpson, 

c) método de Adams-Moulton, 


d) método de Adams-Bashforth, 


e) método 3 de Simpson. 


12.3.4 Erro de Truncamento Local 


Agora, podemos definir formalmente o erro de truncamento local de um método linear de passo 
múltiplo. 


Definição 12.4 - Definimos Erro de Truncamento Local, em £n+x do método linear de passo 


múltiplo, definido por (12.7, por: 
k 
Trp = = L [y => | ajy( Zn+j) E hB;y (En+j)] , 
j=0 


onde y(x) é a solução exata do (p.v.i) (12.2. 
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Observe que o erro de truncamento é chamado local, pois supomos que nenhum erro foi cometido 
anteriormente, isto é, impomos: 


Yn+j = iba) 3=0,1,...,h-1, 
e então só consideramos o erro em Yn+k- 
Pode-se mostrar que: 


ð 
Tnk = L= Bro (Enter fara) (Y(En+k) z Yn+k) - (12.19) 


onde &n+k € (Yn+k, Y(En+k))- 


Supondo que a solução teórica y(x) tem derivadas contínuas de ordem suficientemente elevadas, então 
para ambos, métodos implícitos e explícitos, de (12.19) pode ser deduzido que 


YÚLn+k) — Yn+k = ConhttigtD (a) + 0(h9+2) , 
onde q é a ordem do método. O termo C,nhyl+D(n,) é frequentemente chamado de Erro de 
Truncamento Local Principal. 
Assim, o erro de truncamento local, para : 
a) o método de Euler é dado por: 
h? N 
a Y (E), onde £n < E < tn, 
isto é, o erro de truncamento local é da O(h?), e este é identicamente nulo se a solução de (12.2) é 
um polinômio de grau não excedendo 1. 


b) o método do trapézio é dado por: 
—— y” (£) , onde £n < Ê < rn, 


isto é, o erro de truncamento local é da O(hº), o que representa um aperfeiçoamento sobre o método 
de Euler. Observe que o erro de truncamento local é exatamente o erro da regra do trapézio, fórmula 
(11.14), visto que o lado esquerdo da expressão (12.10) é calculada exatamente. 


Exercício 


12.4 - Determine o erro de truncamento local para: 
a) regra do ponto médio, 

b) método de Simpson, 

c) método de Adams-Moulton, 

d) método de Adams-Bashforth, 

e) método 3 de Simpson. 


As propriedades mais importantes dos métodos numéricos para resolver problemas de valor inicial são 
consistência e estabilidade. 
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12.3.5  Consistência e Estabilidade 


Descreveremos aqui as propriedades de consistência e estabilidade dos métodos de k-passos. Dado o 
método linear de passo múltiplo (12.7), definimos, inicialmente: 


k k 
MO =) g€ e =, M€, 
j=0 j=0 
como sendo o primeiro e segundo polinômio característico, respectivamente. 


Definição 12.5 - Um método linear de passo múltiplo é estável se nenhuma raiz de p(€) tem módulo 
maior do que 1 e toda raiz com módulo 1 é simples. 


Exemplo 12.7 - Verificar se o método de Simpson é estável. 
Solução: Temos que o método de Simpson é dado por (12.13), de onde deduzimos que: 
ag =—1, q =0, ay=1. 


Assim: 


(O) =E -1 > g=&H 
Logo as raízes têm módulo 1 e são simples. Portanto o método de Simpson é estável. 


Definição 12.6 - Um método linear de passo múltiplo é consistente se tem ordem q > 1. 


Assim, por ( 12.18), vemos que um método linear de passo múltiplo é consistente se e somente se 
k k k 
Xaj =0 e X=} joj (12.20) 
j=0 j=0 j=0 
Exemplo 12.8 - Verificar se o método de Adams-Basforth é consistente. 


Solução: Temos que o método de Adams-Basforth é dado por (12.15), de onde deduzimos que: 


ao = 0, b = 4, 
q =, Bi = D 
a = 1, Bo = 0. 
Assim: 
Co = aotatas > C=0-1+1=0, 
1 3 
Cı = a +2az-— (bo + +82) > pese pes RM 


Assim, o método de Adams-Basforth é consistente. 


Definição 12.7 - Se o erro de truncamento local de um método de k-passos é: Capihttyla tD) (ma), 
então dizemos que o método é consistente de ordem q. 


Pelo Exemplo , vemos que o método de Euler é consistente de ordem 1 e que o método do trapézio 
é consistente de ordem 2. 
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Exercício 


12.5 - Determine a ordem de consistência dos seguintes métodos: 
a) regra do ponto médio, 
b) método de Simpson, 


c) método de Adams-Moulton, 


d) método É de Simpson. 


12.3.6 Convergência 


O resultado mais importante sobre métodos de passo múltiplo é saber se a aplicação de um determi- 
nado método será convergente para a solução exata do problema de valor inicial. Seja o (p.v.i.) (12.2), 
cuja solução exata é y(x) e seja o método linear de passo múltiplo (12.7). 


Por convergência entendemos que os valores encontrados convergem para a solução exata do problema, 
isto é, que yn — y(£n) quando h > 0. 


Definição 12.8 - Um método linear de passo múltiplo é convergente se a seguinte afirmação é ver- 


dadeira: Seja f(x,y) satisfazendo as condições do Teorema Se y(x) é solução do (p.v.i.) i 


entao: 
lim Yn = Y(Tn), 
hn=z—a(fixo) 


vale para todo x € |a,b] e todas as soluções yn do método de passo múltiplo tendo valores iniciais y, 
satisfazendo limp—o Yu = Yo, u =0,1,...,k— 1. 


Assim para dar uma idéia de convergência, consideremos que estamos resolvendo um (p.v.i.), com os 
seguintes comprimentos de passo: h = ho, Sho, tho, e 7 — a fixo, como mostrado na Figura 12.1. 


i i i h = ho 
a x 
xo Ti T2 T3 T4 1 
| i | h = ho 
a x 
To Tı xa T3 T4 T5 T6 T7 Tg 1 
H ' ' j ' ' j ' j h = ho 
a x 
Figura 12.1 


Seja yn(h) a notação para o valor de yn obtido por um método numérico quando o tamanho do passo 
é h. Se estamos interessados, por exemplo, no valor de y(x) quando x = z, (Figura 12.1), teremos con- 
vergência se a sequência ya(ho), ya($ho), ys(hho), convergir para o valor de y(Z), ou seja a verificação 
da convergência deve ser feita nos pontos da malha. Em geral, consideramos o caso em que h tende 


CAPÍTULO 12. SOLUÇÃO NUMÉRICA DE EQUAÇÕES DIFERENCIAIS ORDINÁRIAS 395 


continuamente a zero, isto é, consideramos h = 0.1,0.01,.... 


Antes de definirmos as condições que garantem a convergência dos métodos de k-passos, analisemos 
o seguinte: quando calculamos o erro de truncamento local de um método de k-passos, intuitivamente, 
esperamos que tal erro ocorra pela aplicação do método linear de passo múltiplo num passo simples, ou 
seja que o erro ocorra apenas no cálculo de yn, pois consideramos na análise do erro que a solução nos 
pontos anteriores são calculados exatamente. Entretanto, no cálculo de yn, n passos (aproximadamente) 
são usados. Portanto se o erro de truncamento local for da O(hTt1), o erro em yn será: 


nO(hIt!) = nhO(h?) = (£n — xo)O(h?) . 
Assim, se h — 0 com x, fixo, o erro global y(x,) — yn é da O(h9). 
Definição 12.9 - Um método linear de passo mútiplo é convergente de ordem q, se o erro: 
lin) —ym = O(h’), 
quando h > 0, com x, fixo. 


Apresentamos assim uma idéia intuitiva de que se um método é consistente de ordem q então ele é 
convergente de ordem q. Entretanto, podemos enunciar o seguinte teorema, o qual pode ser provado 
rigorosamente. 


Teorema 12.2 - Um método linear de passo múltiplo é convergente de ordem q se e somente se é 
estável e consistente de ordem q. 


Prova: A prova deste teorema pode ser encontrada em [Henrici, 1962]. 


Assim, tanto a consistência como a estabilidade de um método de k-passos são importantes para 
garantir a convergência. Cabe salientar que enquanto a consistência controla o erro local em cada passo 
a estabilidadade controla a forma pela qual o erro se propaga quando o número de passos aumenta. 
Além disso, quanto maior for a ordem de consistência do método, mais rapidamente obteremos a solução 
desejada. 


Exemplo 12.9 - Considere o (p.v.i.): 


y(0) = 1 O<a<l; h=01 


cuja solução exata é y(x) = e”. 


Verifique que, usando o seguinte método: 
Yn+2 = —3Yn + 4Yn+1 ar 2h fn é (12.21) 


com yo = 1, ey = 1.10517 não obtemos a solução do problema original. Analise então as condições que 
garantem a convergência. 


Solução: A tabela a seguir mostra alguns dos valores obtidos com a aplicação do método: 
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0 1 1 


0.1 | 1.10517 | 1.10517 


0.2 | 1.22068 | 1.22140 


0.5 | 1.60638 | 1.64872 


0.7 | 1.63634 | 2.01375 


0.9 | -0.74079 | 2.45960 


1.0 | -6.55860 | 2.71828 


Vemos pelos valores obtidos que o método não é convergente. Analisemos então a consistência e a 


estabilidade. De (12.21), segue que: 


Yn+2 — 4Yn+1 + 3yn = —2hfn . 
e assim: 
ao = 3, Bo = —2, 
Qi = —4, Br = 0, 
Q2 = l, b2 = 0, 
Portanto: 
Co = ao +tai +a: > Co = 3—4+1 = 0, 
C = ay + 209 — Do > Cı = 44242 = 0. 


Logo o método é consistente. Mas, 


pE) = €& —-48+3 = (E-1)(E-3). 


e assim as raízes de p(é) são €= 1 e ¿= 3. Portanto o método não é estável. Isso explica a não 
convergência do método. 


Exercícios 
12.6 - Verifique se o método explícito de dois passos: 
h 
Yn+2 — Yn+1 = gl 2n + 3fn41] , 


pode ser utilizado para resolver um (p.v.i.) com garantia de convergência. 


12.7 - Mostre que o método implícito de dois passos: 


h 
Yn+2 — Yn+1 = 121 fa + 8fn+1 d 4fn+2] , 


não é consistente. 
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12.4 Métodos do Tipo Previsor - Corretor 


Descreveremos aqui como utilizar um método linear de passo múltiplo implícito, para determinar a 


solução do (p.v.i.) (12.2). 


Para os métodos de k-passos implícitos, em cada passo, devemos resolver para yn+k à equação: 


k—1 k—1 
Ynte = — Ý jynn AD bifari + hprf(Entk,Yntk) à (12.22) 
j=0 j=0 
onde Yn+j € fn+j, J =0,1,...,k — 1 são conhecidos. 


Como já dissemos anteriormente, se f for uma função não linear em y, não teremos, em geral, condições 
de resolver (12.22) em relação a yn+k de uma forma exata. Entretanto pode ser provado que uma única 
solução para yn-+k existe e pode ser aproximada pelo método iterativo: 


k—1 k—1 
+1 
AE = — ÑX Ojynsj + hY Bifntj + EEA (12.23) 
j=0 j=0 
onde s = 1,2,..., e mantendo £n+k fixo, y! Em pode ser obtido usando um método linear de passo 


múltiplo explícito. Assim, 
k—1 k—1 
0 
ya, = SE Soy; + AS B; fati E 
j=0 j=0 
Ao método explícito chamaremos Previsor. 


Com esse valor e o método implícito, (12.23), o qual chamaremos Corretor, calculamos yil ki „Pl TETE 


Indicaremos por: 
P: aplicação do Previsor, 
E: cálculo de Hank yE), 
C: aplicação do Corretor. 


O par PC será então aplicado no modo P(EC)” E, onde m é o número de vezes que calculamos f 
e aplicamos C. A iteração finaliza quando dois valores sucessivos de y, obtidos com a aplicação de C, 
satisfazem a precisão desejada. 


Duas questões que surgem naturalmente vinculadas as fórmulas corretoras são: 
1- Sob que condições convergirá a fórmula corretora? 


2 - Quantas iterações serão necessárias para se atingir a precisão desejada? 


A resposta à última pergunta dependerá de muitos fatores. Contudo, a experiência mostra que so- 
mente uma ou duas aplicações da corretora são suficientes, desde que a amplitude do intervalo h tenha 
sido selecionada adequadamente. Caso verifiquemos que uma ou duas correções não são suficientes, será 
melhor reduzirmos a amplitude do intervalo h ao invés de prosseguirmos a iteração. Assim, na prática, 
não usamos m > 2. 


A resposta à primeira questão está contida no seguinte teorema. 
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of 


Teorema 12.3 - Se f(x,y) e a forem contínuas em x e y no intervalo fechado [a,b], e se dy não se 
anular neste intervalo, (12.25) convergirá, desde que h seja escolhido de modo a satisfazer: 


EE 


Prova: Pode ser encontrada em [Conte,19..). 


Podemos agora definir formalmente a aplicação do par PC, no modo P(EC)” E: Calcular a cada 
passo: 


k—1 k—1 
[o] adm] x plm] 
Ynte + D Gym; T DDA 
j=0 j=0 


para s = 0,1,...,m — 1, 
e = Flank UU) 
s+1 k—1 m k—1 m s 
vet = SE agi, + ADS BA, + ht, 


e finalmente, 
JEL, = Many) - 


Exemplo 12.10 - Resolver o (p.v.i.) do exemplo usando o par PC, onde: 


ds Yn+2 = Yn41 F hifa + 3a), 
(12.24) 


C: Yn+2 = Yn + hfn + 4fasi ES fn+2] , 
no modo P(EC)E. Obter os valores iniciais necessários pelo método de Taylor de ordem 3. 


Solução: Temos que: yo = 2 e, pelo exemplo [12.1] yı = 2.0048. Assim, fazendo n = 0 em (12.24), 
obtemos: 


h 0.1 
PD = y + 58h - fo]=20048+ Cu + 3(0.0952)] 
= 2.0191, 
desde que, pelo exemplo [12.1] fo = 0 e fı = 0.0952. Agora, 
E: JO = Hx, y)= f(0.2,2.0191) = -2.0191+0.2+2 
= 0.1809. 
Portanto: 
(1) h (0) (0.1) 
C: y3 = yo + qlfo+4h+ f3 ]=2-+ 5-0 + 4(0.0952) + 0.1809] 


= 2.0187 =y(xo) = y(0.2). 
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Agora: 
E: JO = fas, uy) = f(0.2,2.0187) = —2.0187 + 0.2 + 2 


= 0.1813. 


Finalmente, fazendo n = 1 em (12.24), obtemos: 


h 0.1 
Pd = y+ al-fi + 3f] = 2.0187 - E | 0.0952 + 3(0.1813)] 


= 20411, 


desde que fı = 0.0952 e f{® = 0.1813. Agora, 


E: SO = fas, y) = f(0.3,2.0411) = -2.0411+0.3+2 
= 0.2589. 
Portanto: 
Cry = n+ Piran 
2.0048 + CP [0.0952 + 4(0.1809) + 0.2589] 


= 2.0407 ~ y(z3) = y(0.3). 


Assim, a solução do (p.v.i.) dado é: 


Tn Yn 


0.0 | 2.0000 
0.1 | 2.0048 


0.2 | 2.0187 


0.3 | 2.0407 


399 


Compare os resultados obtidos com a solução obtida nos exemplos anteriores. Lembre-se que a solução 


exata do (p.v.i.) é: y(r) =e” +ar+l. 


12.4.1 Erro de Truncamento Local 


Supomos a aplicação do par PC, no modo P(EC)” ou P(EC)” E onde o previsor tem ordem q* > 0; 


o corretor tem ordem q > 1 e m > 1. Pode-se mostrar que: (ver [Lambert, 19..)) 


1) se q* > q então o erro de truncamento local principal do par PC é o mesmo do C. 
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2) se q* = q — j; 0 < j < q então o erro de truncamento local principal do par PC é: 


2.1) o mesmo do C sem >j+1, 
2.2) da mesma ordem do C, mas diferente dele se m = j, 
2.3) da forma kh tm + (hM) sem<j—l. 


Exercícios 
12.8 - Resolver o seguinte (p.v.i.): 
y =r +y 
y(0) = 1; x € [0,0.4]; h = 0.2 


usando o par PC, onde: 
P: Yn41 = Yn T ifra 


C: Yn41 = Yn T hifat faril 


no modo P(ECP E. 


12.9 - Considere o (p.v.i.): 


Resolva-o usando o par PC, onde: 


P: Yn+2 = Un41l T PE fa + 3a). 


C Yn42 = Yada + B-f + 8fn41 + fra] 


no modo P(EC)E, e o método de Taylor de ordem 3 para obter os valores iniciais necessários 


12.10 - Resolver o (p.v.i.): 


usando o par PC, onde: 


P: Yn43 = Yn+2 + T ifa — 16 fn+1 + 23 fn+2] , 


C: Yn42 = Yn + Blfa + Afaia + faso], 
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no modo P(EC)2E, e o método de Taylor de ordem 3 para obter os valores iniciais necessários. 
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12.5 Método Geral Explícito de 1-passo 


Muitas vezes desejamos resolver o (p.v.i.) usando um método de k-passos; k > 1. Precisamos 
então obter os valores iniciais necessários, para se utilizar tal método, que sejam o mais preciso possível. 
Isto pode ser feito através do método de Taylor de ordem q, se possível, pois nem sempre existem as de- 
rivadas de ordem superior da f, ou então pelos métodos de Runge-Kutta, desde que ambos são métodos 
explícitos de 1-passo. Os métodos de Runge-Kutta, assim como o método de Taylor de ordem q, também 
podem ser utilizados para determinar a solução do (p.v.i.) para x € [a,b]. 


Definição 12.10 - Um método geral explícito de 1-passo é definido pela relação: 


Yn41 — Yn = hn, Yn, h) . (12.25) 


onde & é uma função que depende de £n, Yn eh. 


12.5.1 Ordem 
Definição 12.11 - O método (12.25) é de ordem q, se q é o maior inteiro tal que: 


ulz+h) — ylz) — ho(z,yla),h) = O(h), (12.26) 


onde y(x) é a solução exata do (p.v.i.) (12.2). 


12.5.2 Consistência 
Definição 12.12 - O método é consistente com o (p.v.i.) se: 
plz, y,0) = f(x,y). (12.27) 
Exemplo 12.11 - Considere o método de Taylor de ordem q, dado por (12.5). 
a) Verificar que é um método geral explícito de um passo. 
b) Determinar sua ordem, usando (12.26). 
c) Verificar se é consistente, usando (12.27). 
Solução: Temos por (12.5), que: 


h2 ha 
Yn+1 = Yn +h fa + = fnt... +— (a) 
2! q! 
= h | h Ed | ha (g—1) 
= Yn Jad J] Ía paea q É 
= Yn? hor(tn, Yn, h) , 


onde denotamos por r(x, y, h), a função ọ do método de Taylor calculada no ponto (x,y), isto é: 


h hat 
ór(z,y,h) = f(x,y) + z (x,y) +... + Ea JEP (x,y). (12.28) 
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Assim (12.5) é um método geral explícito de um passo. Agora, 
y(z+h)— uz) — hó(x,y,h) 


h ha 
= y(a)+ hy'(a) + gt P) Fant ga) + O(ht*t) 


q—1 


= ul) -htnt 5100) t E Dey) + O) 


= O(h). 


onde desenvolvemos y(x + h) em série de Taylor em torno do ponto x e substituimos d(x, y, h) pela dr . 
Portanto o método de Taylor tem ordem q e é consistente com o (p.v.i) (12.2), pois ó(x,y,0) = f(x,y). 


12.5.3 Convergência 
Teorema 12.4 - Seja d(x,y,h) satisfazendo as condições: 


i) d(x,y,h) é contínua em 


S=f(e,y,h)a<a<b;-co <y<o;0O<h<ho,ho>0+. 


ii) d(x,y,h) satisfaz a condição de Lipschitz em relação a y, isto é: 
Hr, y, h) — læ, y*,h)| < Ly-y'l, 
para todos os pontos (x,y, h) e (x,y*,h) em 5. 
Então o método é convergente se e somente se é consistente. 


Prova: A prova deste teorema pode ser encontrada em ... 


Para todos os métodos que estudaremos aqui, as condições i) e ii) do Teorema [12.4] são satisfeitas 
se f(x,y) satisfaz as hipóteses do Teorema [12.1] Para tais métodos consistência é condição necessária e 
suficiente para garantir convergência. Note que não existe exigência correspondente a estabilidade, desde 
que nenhuma solução parasítica pode ocorrer com método de um passo. 


Exercícios 
12.11 - Considere o método de Euler, dado por (12.8). 
a) Verificar se é um método geral explícito de um passo. 
b) Determinar sua ordem, usando (12.26). 
c) Verificar se é consistente, usando (12.27). 
12.12 - Mostre que um método do tipo consistente tem ordem pelo menos 1. 


Estamos agora em condições de definir os métodos de Runge-Kutta. 
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12.5.4 Métodos de Runge-Kutta 


Definição 12.13 - O método geral de Runge-Kutta de R estágios é definido por: 


Yn+1 — Yn = họ(£n, Yn, h) , 


onde 
R 
diet) = Sed; (12.29) 
r=1 
kı = f(x,y), 
r—1 
kr = flx+açh, y+h X brsks) E a A E 
s=1 


r—1 
a= Y bng ps A sendo: 
s=1 


Para se obter métodos de Runge-Kutta devemos determinar as constantes c,,a, e brs da definição 
12.13] Determinamos estas constantes comparando a expansão da função (x, y, h), definida por (12.29), 


em potências de h, com a função r(x, y, h) do método de Taylor, (12.28), no sentido de se obter métodos 
de determinada ordem. Veremos a seguir como fazer isso. 


Métodos de Runge-Kutta de ordem 2 


Consideremos incialmente, que desejamos obter métodos de Runge-Kutta de 2 estágios. Devemos 
tomar então R = 2, na definição (12.13). Assim: 


olx,y,h) = ck + coka, 
kı = f(x,y), 
ko = fla +ash, y+hboaki) , 


a = by. 


Portanto: 
k2 = flx+ash,y + hazf). 


Desenvolvendo ks em série de Taylor em torno do ponto (x, y), obtemos: 


(azh)? 


ko = fley) + (aah) fel, 9) + (has f) falan) + SE 


fza(£, y) 


(hazf)? 


+ (azh)(ha2f)fzy(£, y) + 2! 


fonte, y) + O(h?) . 
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Portanto: 
d(x,y,h) = ciki + czko 
E 
= af+Ho|f+ (azh) fa T (azhf) fy + a j fas 
h 
+ (ash) f fry + (oa! n ~E fyy + O(h?) 
= (& +c2)f + czazh( fe + fyf) 
a h 
p N aatia FEN: 
onde agrupamos os termos de mesma potência de h. Denotando por: 
F = fe+ fyf e G = fes t+2f frey + fyf. (12.30) 
obtemos: R 
olz, y, h) = (c1 + c2) f + coashF + (az z j c2G + 0(h?), (12.31) 
Agora, podemos escrever a função dr(x,y,h), (12.28), como: 
h 1 h? 1 3 
h h? 
= f t z H faf) H 31 (Fra 2 fry f 
+ fuf? t+ felt Fi F) +O’) 
Agrupando os termos semelhantes e usando (12.30), obtemos: 
ho 3 
ọrlxz,y,h)=f 4 zf i z1 [G + fF] + 0(hº) (12.32) 


Para determinar um método de 2 estágios e ordem máxima, comparamos (12.31) com (12.32), obtendo: 


c+ co = 1 
(12.33) 


1 
Cada = 5 


Resolvendo esse sistema iremos obter métodos de Runge-Kutta de ordem 2, pois na definição (12.13), 
temos hg(x,y,h) e portanto estamos impondo igualdade até termos da O(h2). Além disso, como o sis- 
tema possui 2 equações e 3 incógnitas, este possui infinitas soluções e portanto podemos afirmar 
que existem infinitos métodos de Runge-Kutta de 2 estágios e ordem 2. 
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Observe que para se obter um método de Runge-Kutta de 2 estágios e ordem 3, é necessário que além 
de (12.33) tenhamos: 


2 
ota n 1 1 
2 us 6. gF 
2 
a3C2 1 1 
= F; 
E (5 di 5) 614 


A igualdade acima só pode ser satisfeita impondo severas condições sobre a função f, e portanto não 
existem métodos de Runge-Kutta de 2 estágios e ordem 3. 

Assim, atribuindo um valor para uma das constantes em (12.33), obtemos as outras duas, em função 
desta. Os métodos de Runge-Kutta de 2-estágios e ordem 2, mais usados são obtidos tomando: 


a)c=>05>co=lea = L Portanto: 


Yn+1 = Yn + hkz onde : 
kı = ftn, Yn), (12.34) 
ka = Ih Ihk 

2 Han + 5h, Ynt 3 1), 


que é conhecido como Método de Euler Modificado. Observe que apesar de kı não aparecer 
explicitamente, ele deve ser calculado a cada passo. 


b) a = à > €C = Í ea = 1. Portanto: 
Yn+1 = Ynt R (ki + ka) , onde : 
kı = f(tn;Yn), (12.35) 


k2 Fm +h, Yn + hki) , 


que é conhecido como Método de Euler Melhorado. 


Exemplo 12.12 -Usando o método de Euler Modificado, resolva o (p.v.i.) do exemplo [12.1] 
Solução: Temos que yo = 2, (condição inicial). Fazendo n = 0, em (12.34), obtemos: 

yı = yo+hks, 
onde: 


kı = f (zo, yo) = f (0,2) =—2+0+2=0, 


0.1 0.1 


1 1 : 
k2 f (20 + gts + TI = (0+ z 2t o) 


= f(0.05,2) = —2 + 0.05 + 2 = 0.05 . 


CAPÍTULO 12. SOLUÇÃO NUMÉRICA DE EQUAÇÕES DIFERENCIAIS ORDINÁRIAS 406 


Portanto: 
yı = 2+0.1(0.05) = 2.005 = y(x1) = y(0.1) . 


Fazendo agora n = 1, em (12.34), obtemos: 


y2 = yı +hkə, 
onde: 
kı = f(x,y) = f(0.1,2.005) = —2.005 + 0.1 + 2 = 0.095, 
ko = f (ax + Ihm + TI =f (oa 2 2.005 = (0.095) ) 
= f(0.15,2.0098) = —2.0098 + 0.15 + 2 = 0.1403 . 
Portanto: 


y2 = 2.005 + 0.1(0.1403) = 2.0190 = y(z2) = y(0.2) . 
Finalmente, fazendo n = 2, em (12.34), obtemos: 


y3 = yo +hko, 
onde: 
kı = f(xo,y2) = f(0.2,2.0190) = —2.0190 + 0.2 + 2 = 0.1810 , 
1 1 0.1 0.1 
ko = f (a + 3h Y2 + Sha) =f (o2 + =z > 20190 + (01810) ) 
= f(0.25,2.0281) = —2.0281 + 0.25 + 2 = 0.2220 . 
Portanto: 


y3 = 2.0190 + 0.1(0.2220) = 2.0412 = y(x3) = y(0.3) . 


Assim, a solução do (p.v.i.) dado é: 


Tn Yn 
0.0 | 2.00000 
0.1 | 2.005 
0.2 | 2.0190 
0.3 | 2.0412 


Métodos de Runge-Kutta de ordem 3 


Se desejamos obter métodos de Runge-Kutta de 3 estágios, devemos além do que já foi feito na seção 
anterior, desenvolver também ks em série de Taylor, pois os métodos de Runge-Kutta de 3 estágios são 
obtidos a partir de: 

Yn+1 = Yn + h(ciky + c2k2 + c3k3) , 
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onde, kı e k2 possuem as mesmas expressões do método de 2-estágios e, 


ks = f(x + haz,y + hbzıkı + books) 


= f(x+ haz,y+ h(az — ba2)k + b32k2) , 


desde que a3 = b31 + b32. Devemos então agrupar os termos semelhantes e compará-los com a r(x, y, h). 
Como pode ser observado na seção anterior, a obtenção de métodos de Runge-Kutta envolve manipulações 
tediosas, e assim serão omitidas. Daremos aqui apenas o sistema obtido quando se compara É com dr 
para se obter métodos de Runge-Kutta de 3 estágios e ordem máxima. Assim: 


Cı + C2 + C3 = 1 


c2a2 + cza = à 

12.36 
caba24 = 1 
303202 = & 


1 
C202 + c33 = 3 


que é um sistema de 4 equações e 6 incógnitas, onde comparamos os termos de 4 e dr até O(hº). 
Atribuindo valores a duas das variáveis obtemos as outras quatro em função destas. Novamente temos 
infinitos métodos de Runge-Kutta de 3 estágios e ordem 3. Também nesse caso não conseguimos métodos 
de 3 estágios e ordem 4 a menos que se imponha condições sobre a f. 


Os métodos de Runge-Kutta de 3 estágios e ordem 3, mais populares, são obtidos de (12.36), fazendo: 


a) & = lec = 0. 


Assim, da primeira equação, de (12.36), obtemos: c3 = 3, Substituindo na segunda equação segue 


que das = } > a3 = 2. Finalmente da última equação, resulta que: 


que é satisfeita para qualquer valor de a2. Escolhendo então as = t obtemos da terceira equação 
que b32 = A Portanto: 
Yn+1 = Yn + hfk + 3k3) , onde 


kı = f(n, Yn), 
(12.37) 
ho = fan + $h, yn + $hki) , 


ks = fan + Zh, yn + $hkə) , 


que é conhecido como Método de Heun. Novamente, o termo ks não aparece explicitamente, mas 
deve ser calculado a cada passo. 
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b) C2 = cCge ag = as. 


Substituindo os valores na segunda e quarta equações, segue que: 


2csas = l > C343 = l 
(12.38) 
1 


2c3a2 = i > c3a3 = G 
Substituindo em (12.38), a primeira equação na segunda obtemos que: as = 2 = ao. Assim 
C3 = 3 = co. Da primeira equação obtemos: cı = 1 — 2c3 = 1 — 3 >a = ł . Finalmente, de 


C3b3202 = E segue que: b32 = 2. Portanto: 


Yn+1 = Yn h [ka H 3 (k2 H k3)| ,onde: 


kı = f(En, Yn), (12.39) 


ka = f(En + 3h, yn + Aki) , 


ks = f(£n+ h, yn + Zhkə) , 
que é conhecido como Método de Nystrom. 


Exemplo 12.13 - Resolver o (p.v.i.) do exemplo |[12.1| usando o par PC dado por |12.24) no modo 
P(EC). Obtenha os valores iniciais necessários pelo método de Heun, fórmula (12.37. 


Solução: Temos que yo = 2, (condição inicial). Fazendo n = 0 em (12.37), obtemos: 


h 
yı = Yo + g% + 3k3) , onde : 


kı = f(xo,yo) = f(0,2)=-24+0+2=0, 


1 1 0.1 0.1 
ko = F(£o + zh, yo + zhkı) = f+ -2+ -z (0), 


= f(0.0333,2) = —2 + 0.0333 + 2 = 0.0333 


2 0.2 0.2 
h, yo + gltka) = f0+ gor 3 (0.0333)) 


2 


ks = Hao+s 


f(0.0667, 2.0022) = —2.0022 + 0.0667 + 2 = 0.0645 


Assim g 
yı = 2+ (0 + 3(0.0645)) = 2.0048 = y(z1) = y(0.1) 


Desde que yı = 2.0048, a determinação de yz e y3, usando o par PC dado por|12.24| no modo P(EC), 
fornece exatamente o mesmo resultado do exemplo |12.10| ou seja, a solução do (p.v.i.) dado é: 
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Tn 


0.0 


0.1 
0.2 


0.3 


Métodos de Runge-Kutta de ordem 4 


Yn 


| 2.0000 


2.0048 


2.0187 


2.0407 


Neste caso, a comparação de ġọ com ġr, para se obter métodos de Runge-Kutta de 4 estágios e or- 
dem máxima, fornece um sistema de 11 equações e 13 incógnitas. Cada solução desse sistema define um 
método de Runge-Kutta com ordem 4. Portanto existem infinitos métodos de Runge-Kutta de 4 estágios 


e ordem 4. 


O dois métodos mais utilizados de Runge-Kutta de 4 estágios e ordem 4 são dados por: 


mai = Plk + 2(kz + ks) + ka] onde : 


kı = 


ko = 


k3 = 


ka = 


f(n, Yn) » 


Flen + ds tn + bhha), (12.40) 


Flen + dh, Un + bhko), 


Tita T h, Yn +F hks) , 


YUn41 — Yn = hik + 3(ko + k3) + ks] onde: 


kı = Enab 


ko = Flan À 


ks = Fan 


E Lh, Yn + Lhki) , (12.41) 


Zh, yn — $hkı) + hko), 


ka = fan +h, Yn + hkı 
Exemplo 12.14 - Resolver o (p.v.i.) do exemplo usando o método dado por (12.40). 


Solução: Temos que yọ = 2. Fazendo n = 0 em (12.40), obtemos: 


h 


hkz + hks) , 


y = Yo [ti H 2(ko + k3) + ka], 
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onde: 


Portanto: 


Fazendo n = 1 em 


onde: 


kı 


k2 


k3 


k4 


kı 


k2 


ks 


k4 


T f(zo,y0)=0 , 


1 1 
= (zo + zh Yo + zhki) , 


0.1 0.1 


= f0+ Ei “a (0)) = f(0.05,2) = 0.05, 
= f(zo+ s + b ) 
= To 2 » Yo 2 2); 
0.1 0.1 
= f0+ Cs + =z (0.05) = f(0.05, 2.0025) = 0.0475 , 


= (£o + h, yo w hks) , 


= f(0+0.1,2+ 0.1(0.0475)) = f(0.1,2.0048) = 0.0952 


1 
y = 2+ o + 2(0.05 + 0.0475) + 0.0952] 


I 


2.00484 = y(x1) = y(0.1) , 


12.40), obtemos: 


yo = À [ti H 2(ka + ks) + kal , 


f(x1,y1) = f(0.1,2.00484) = 0.0952 , 
flw + + E ) 
Tı 2 Y1 2 1); 
0.1 0.1 
f (0.1 + -> 2.00484 + -~ (0.0952)) = f (0.15, 2.0096) = 0.1404 , 
fla + F + dk ) 
Tı 2 Yı 2 2); 
0.1 0.1 
f(0.1 + -z > 200484 + -z (0.1404)) = f(0.15,2.0119) = 0.1381 , 


Fx = h, yı $ hks) , 


(0.1 + 0.1,2.00484 + 0.1(0.1381)) = (0.2,2.0187) = 0.1813 . 
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Portanto: 
0.1 
y2 = 2.00484 + [00952 + 2(0.1404 + 0.1381) + 0.1813] 


= 2.01873 = y(z2) = y(0.2) , 


Finalmente, fazendo n = 2 em (12.40), obtemos: 


h 
Y3 = Y2 + =[k1 + 2(kə + ks) + kal ; 


6 
onde: 
kı = f(z2,y2) = f(0.2, 2.01873) = 0.1813 , 
1 1 
ko = F(as + =h, yo + =hkı) , 
2 2, 
0.1 0.1 
= f(0.2 + Z, 2.01873 + (0.1813)) = f (0.25, 2.0278) = 0.2222 , 
1 1 
ks = fx + zot + z2) ; 
0.1 0.1 
= f(0.2 + ==, 2.01873 + —-(0.2222)) = f (0.25, 2.0298) = 0.2202 , 
k4 = f(x2+ h, y2+ hka), 
= f(0.2 + 0.1, 2.01873 + 0.1(0.2202)) = f(0.3, 2.0408) = 0.2592 . 
Portanto: 


1 
y2 = 2.01873 + O1 0.1813 + 2(0.2222 + 0.2202) + 0.2592] 


= 2.04082 ~ y(x3) = y(0.3) , 


Assim a solução do (p.v.i.) dado é: 


Tn Yn 
0 2 


0.1 | 2.00484 


0.2 | 2.01873 


0.3 | 2.04082 


Pelo que foi visto nessa seção nos dá a impressão que podemos obter sempre métodos de Runge-Kutta 
de R estágios e ordem R. Entretanto, [Butcher, 1964], provou a não existência de métodos de Runge- 
Kutta de 5 estágios e ordem 5. Além disso, provou o seguinte resultado: Seja q(R) a maior ordem que 
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pode ser obtida por um método de Runge-Kutta de R estágios. Então: 


R) = R,R=1,2,3,4, 
a(s) = 4 

q6) = 5 

a7) = 6 

a(s) = 6 

q(9) 7 

R) < R-2, R=10,11,... 


Na prática os métodos de Runge-Kutta mais utilizados são os de ordem 4. 


Exercícios 


12.13 - Mostre que o método de Euler melhorado é equivalente a aplicação do método previsor-corretor, 
onde o previsor é o metodo de Euler e o corretor o método do trapézio, aplicados no modo P(EC) E. 


12.14 - Resolva o (p.v.i.) do exemplo usando o método da Adams-Basforth. Escolha um método 
de Runge-Kutta de ordem 2, para obter os valores iniciais necessários. 


12.15 - Verifique que, usando o método de Euler modificado para resolver o (p.v.i.): 


y = y-a 
y(0) = 2; x € [0,0.5]; h = 01 

obtem-se: 

Zn Yn y(x) =e +r+1 

= 0.1 | h = 0.01 

0.0 | 2.00000 | 2.00000 2.00000 

0.5 | 3.14145 | 3.14870 3.14872 

1.0 | 4.71408 | 4.71824 4.11828 


12.16 - Resolva o (p.v.i.) do exemplo usando o método de Nystrom. 


12.17 - Obter um método de Runge-Kutta de 3 estágios e ordem 3, tomando em Le = l e C2 = 
2 
A 


12.6 Sistemas de Equações e Equações de Ordem Elevada 


Até agora nos preocupamos em resolver equações diferenciais de primeira ordem, mais especificamente 
problemas de valor inicial de primeira ordem. Entretanto, a maioria das equações diferenciais com 
importância prática, são de ordem maior que 1 ou então são sistemas de equações diferenciais. Veremos 
inicialmente como resolver um sistema de equações diferenciais de primeira ordem, e, para finalizar esse 
capítulo, como resolver numericamente uma equação diferencial de ordem elevada. 
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12.6.1 Sistemas de Equações Diferenciais 


Consideremos um sistema de n equações diferenciais de primeira ordem: 


Yi filt, Y1, Y2,- --;Yn) 
yo = fol, Y1, Y2,- --;Yn) 


Yh = fnl£, Y1, Y2,- --, Yn) 


o qual pode ser escrito, como: 
y = f(x,y), 


onde y, y' e f são vetores com componentes y;, y; e fi, (i = 1,2,...,n), respectivamente. Para que esse 
sistema possua uma única solução é necessário impormos uma condição adicional sobre y. Esta condição 
é usualmente da forma: 

y(xo) = yo, 


para um dado número xo e um vetor yo. Condições suficientes para a existência e unicidade de solução 
de tais sistemas podem ser encontradas em [Rao,1981]. 


Agora descreveremos como os métodos apresentados nas seções anteriores para a solução de equações 
diferenciais de primeira ordem podem ser aplicados para resolver sistemas de equações diferenciais de 
primeira ordem. Para efeito de simplicidade, e sem perda de generalidade, consideramos apenas o caso 
em que n = 2, isto é, o sistema possui apenas duas equações, e, para maior clareza usaremos a notação: 


y = f(z, Y, z) 
z' = g(x,y, 2) 
(12.42) 
y(z0) = yo 
2(x0) = zo x € [zxo, b] 
Assim, se desejarmos resolver o sistema (12.42) pelo método de Euler, teremos: 
Yn41 = Yn? hf (£n, Un, Zn) 
(12.43) 
Zn+1 = Zn T hg(tn, Yn, Zn) 


que será aplicado passo a passo, como mostra o exemplo a seguir. 


Exemplo 12.15 - Usando o método de Euler, resolver o seguinte sistema diferencial: 


y =z 
z =y+e" 
y(0)=1 


z(0)=0 «e[0,02, h=01 
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Solução: Para esse sistema, usando a fórmula (12.43), obtemos: 


Assim, fazendo n = 0, 


yı 
2 = 


Para n = 1, segue que: 


Y2 
Z2 = 


Yn+1 


Zn+1 


obtemos: 


yo + h(zo) = 1 + 0.1(0) 


Yn + h(2n) 
= anthlon +e”) 


= 1 ~ y(z1) = y(0-1) 


zo + h(yo + e®™°) = 0 + 0.1 (1 + e?) = 0.2 ~ z(x1) = z(0.1) 


yı + h(z1) = 1 + 0.1(0.2) 


= 1.02 ~ y(x2) = y(0.2) 


zı + h(—y1) = 0.2 + 0.1(1 + e™t) = 0.4105 = z(x95) = 2(0.2) 


Assim, a solução do sistema dado é: 


Tn Yn Zn 
0.0 1 0 
0.1 1 0.2 
0.2 | 1.02 | 0.4105 


Exemplo 12.16 - Resolver o sistema dado no exemplo usando o par PC, onde: 


no modo P(EC)E. 


Solução: Temos então: 


F: Yn+1 = Yn 


C: Yn+i = Yn 


Yn+1 — 
P: 
0 
a = 
0 
na = 
E: 
0 
Ea = 
1 
Tan = 
C: 
1 
a = 
1 
hi E 
E: 
1 
an Z 


+hfn, 


za ia o Tag] , 


= Yn T hfn 


Zn T hgn 


Hans, VA 2) 


0 0 
g(En+1, Yi z0) 


h o 
yn + z lfa + fasal 
h o 
Zn T 2 [9n F g®] 
(1) 


1 
Fins, y®,, Zaai) 


1 1 
glEn+1,; Ta A 
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No nosso problema: 


Assim, fazendo n = 0, obtemos: 


UA = 
P: 

AOSS 

Re 
E: 

P = 

T 
Ei 

gui 

ps 
E: 

{P = 


Logo: 


Ín = Fln Unia) = Zn 


In = MD Yn, Zn) = yte, 


fe E zE) 


+1 — “n41o 


k=0,1, 


y® de et —1 + (9-1) = 2.1051 


h 0.1 
yo + zlo + f] = 1+ [040.2] = 1.01 

h 0.1 
zo + 5190 + 99] = 0 + [2 + 2.1051] = 0.2053 


z{® = 0.2053 


= yP +e" =1.01 +e®? = 2.1152 
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Agora, fazendo n = 1, obtemos: 


y$ = yı + h(fi) = 1.01 + 0.1(0.2053) = 1.0305 
P: 
4 = z + h(g1) = 0.2053 + 0.1(2.1152) = 0.4168 
O = 4) = 0.4168 
E: 
99 = yP +e”? = 1.0305 + O) = 2.2519 
h 0.1 
y® = y zl (O = 1.01 + “> [0.2053 + 0.4168] = 1.0411 
C: 
h 0.1 
2P = a+ z+ 982] = 0.2053 + > [2-1152 + 2.2519] = 0.4237 
Logo: 
yP 1.0411 y(z2) y(0.2) 
PE 0.4237 z(z2) z(0.2) 


Portanto, a solução do sistema dado é: 


Tn Yn Zn 


0.0 1 0 


0.1 | 1.01 | 0.2053 


0.2 | 1.0408 | 0.4231 
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Exemplo 12.17 - Resolver o sistema dado no exemplo usando o método de Euler Melhorado, 


fórmula (12.35). 


Solução: Para resolver um sistema usando (12.35), fazemos: 


Yn+1 = Yna hki + ka) € 


2 
Zn+1 = 2n + kia + 4&2) , onde: 
kı = f(n, Yn, 2n) , 
li = (En, Yn, Zn) , 
ko = f(n + Rh, Yn + hki, zn + hki), 


bə = glEn + h, Yn F hli, Zn = hli) 


(12.44) 


Fazendo então n = 0 em (12.44), e lembrando que: f(x,y,z) =z , glx, y,z) =y +e”, zo = 0, yo = 
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1, zo = 0, e h = 0.1, obtemos: 


h 
Yı = Yo+ o(a + ko), 
h 
2 = 20+ z% + Lo) , 
onde: 
kı = f (z0, Yo, zo) = f(0,1,0)=0 , 
l = g(xo, Yo, z0) = g(0, 1,0) = 2 , 
k2 = Flxo qa 0.1, Yo ES (0.1)k1, zo + (0.1)k1) = f(0.1,1,0) =0 , 
ta = g(zo+0.1, yo + (0.1)4, zo + (0.1)41) = g(0.1, 1.2, 0.2) = 2.3052 . 
Assim: 
.1 
yı = reS m=t, 
2 
0.1 
z = 0+ o (2 + 2.3052) = 0.2153 , 
Logo: 


yı 1 y(zı) y(0.1) 
zı E 0.2153 E z(x1) E z(0.1) 


Fazendo agora n = 1 em[12.44), obtemos: 


h 
v2 = y+z(ki tko), 
e 
h 
z2 = z+ z + Lo) 5 
onde: 
kı = Far, Yi, 21) = f(0.1, 1, 0.2153) = 0.2153 ; 
lı = g(%1,y1,z1) = g(0.1, 1, 0.2153) = 2.1052 , 
la = g(xı+0.1,yı + (0.1)4, z1 + (0.1)4) = g(0.2, 1.2105, 0.4258) 


= 1.2105 + e”? = 2.4319 . 
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Assim: 
0.1 
y = 1+ -z (0-2153 + 0.2368) = 1.0226 , 
e 
1 
z1 = 0.2153+4 O- (21052 + 2.4319) = 0.4422 , 
Logo: 
Y2 1.0226 y(z2) y(0.2) 
Z2 0.4422 z(x2) z(0.2) 


Portanto, a solução do sistema dado é: 


Tn Yn Zn 


0.0 1 0 


0.1 1 0.2153 


0.2 | 1.0226 | 0.4422 


Pelos exemplos desta seção, vemos que a aplicação de um método numérico a um sistema de equações 
ordinárias de primeira ordem se processa como no caso de uma única equação, só que aqui devemos 
aplicar o método numérico a cada uma das componentes do vetor. 


12.6.2 Equações Diferenciais de Ordem Elevada 


Finalmente, mostraremos como equações de ordem elevada podem ser escritas e portanto resolvidas 
como um sistema de equações de primeira ordem. Consideremos a equação diferencial de ordem n: 


y™ = f(z, Y, ya dis ge) B 


com as condições iniciais: 


y(zo0) = vo , y' (z0) = 95, Dx) = yf . 


Novamente, para simplicidade, mas sem perda de generalidade, consideremos a equação diferencial de 
segunda ordem: 


y” = f(x,y,y) 
y(zo) = Yo (12.45) 
y'(zo) = w 


Podemos resolver qualquer equação diferencial de ordem elevada reduzindo-a a um sistema de equações 
diferenciais de primeira ordem. Para tanto basta fazer uma mudança adequada de variável, para a equação 
de segunda ordem, (12.45). Fazendo a seguinte mudança de variável: 


obtemos: 
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Assim o (p.v.i.), (12.45), se reduz a: 


y =z 
2 = g(x,y, z) 

12.46 
y(z0) = wo Ro 
z(zo) = 20 


Daremos agora alguns exemplos. 
Exemplo 12.18 - Resolver a equação diferencial de segunda ordem: 
y" -y=e” 
y(0) = 1 
y(0) = 0 x € [0,0.3], h=01 
usando o método de Euler. 


Solução: Fazendo y' = z obtemos que: z’ = y+ e”. Assim a equação de segunda ordem fica reduzida ao 
sistema: 


) 
z(0)=0 «€[0,03], h=01 


Observe que o sistema obtido é exatamente aquele dado no exemplo [12.15] e portanto já determinamos 
sua solução. Além disso, cabe salientar que, a solução aproximada da equação diferencial de segunda 
ordem encontra-se na primeira componente do vetor, isto é, apenas nos interessa o valor de yn, apesar de 
termos de calcular, a cada passo, todas as componentes do vetor. Para a equação dada a solução exata 


é: y(x) = lfer(1 + 2x) + 3e7”]. 


Exemplo 12.19 - Escrever a equação diferencial de terceira ordem: 


y" — Day" + 4y' — x?y =f 


na forma de um sistema de equações diferenciais de primeira ordem. 


Solução: Fazendo: y' = z e z’ = w, obtemos: 
y =z 

Z = w 
2rw — 4z +42 +1 


II 
co o 
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Exercícios 
12.18 - Considere o sistema de equações diferenciais de primeira ordem: 


yo = y’ — 2yz 
z! = ey+ylsen z 
y(0) = 1 
z(0) = —1 
Resolva-o usando: 
a) método de Euler, 
b) Método de Adams-Bashforth, 
c) Método de Nystrom. 


12.19 - Usando o par PC, onde: 


P: Yn+2 = Ynyı + hi- fat 3ail: 
h 


C Yn+2 = Yny + golfa +8fn+1 + 5fn+2] 
no modo P(EC)E, resolva a equação diferencial de segunda ordem: 
y” +3y' +2y = e” 
y(0) = 1 
y(0) = 2, xe[0,0.4], h= 0.05. 
12.7 Exercícios Complementares 
12.20 - Considere o seguinte problema de valor inicial: 
y' = 2x? — 27y 
y(0)=1 x € [0,0.3]; h= 0.15 
Rseolva-o: 
a) pelo método de Euler, 
b) pelo método de Taylor de ordem 2. 
12.21 - Resolva aproximadamente o problema de valor inicial: 
y=y+a 


y(0) = 1 x € [0,0.2];; h=01, 


escolhendo q adequadamente tal que seja possível a aplicação do método de Taylor de ordem q. 
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12.22 - O (p.vii.): 


y(l) = 6 com h = 2, 


tem como solução exata y(x) = 3x +3. Usando o método de Euler, determine y(T). Era de se esperar 
tal concordância mesmo com h bastante grande? Por que? 


12.23 - Considere o método de Quade: 


8 6 
Un+4 gg Un+3 Yn+1)— Yn = ggr + 4(fn+3 + fas) + fa - 
a) Determine sua ordem e a constante do erro. 
b) Verifique se este método pode ser aplicado para resolver um (p.v.i.) com garantia de convergência. 


12.24 - Mostre que a ordem do método de passo múltiplo: 


Yasa +(b— 1ynt1) — byn = FALO B) fa + (30+ fi] 


é 2 se b #4 —l1 e 3 se b= —1. Mostre que o método não é estável se b = —1. 
12.25 - Considere o método explícito de 2-passos: 
Yn+2 + 4Yyn+1 — 5Yn = h[bıfn+1 + bo fn] - 
a) Mostre que bı e bo podem ser determinados se a ordem do método for q = 3. 
b) Calcule a constante do erro. 


c) Este método de ordem 3 foi aplicado ao (p.v.i.): 


y(0)=1 x € [0,1.0]; h=01, 


e os cálculos foram realizados com seis casas decimais. O valor de yio tornou-se negativo. Explique 
porque o erro foi tão grande. 


12.26 - Resolva o seguinte problema de valor inicial: 
y'=2ty-y’ +1 
y(0)=1 x € [0,0.2];; h = 0.05 
usando: 
a) método de Euler, 


b) método previsor-corretor, onde 


P3 Yn+1 = Yn T hfn 


C : Yny1 = Yn + A + fnsa] 


usando o par PC no modo P(ECYE, 
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c) método previsor-corretor, onde 


P: Yn+2 = Yn+1 T hi fn F 3fn41] 
C : Yn+2 = Yn+1 m! Ta k 8fn41 k 5fn+2] 


usando o par PC no modo P(EC)E. Obtenha yı pelo método de Taylor de ordem 3 ou pelo método 
de Heun. 


12.27 - Prove que se o método de Runge-Kutta é consistente então Ea cr=1. 
12.28 - Resolva o seguinte sistema de equações diferenciais ordinárias: 
y =y+z 


2 = 2y + 3z 


y(0)=2 
z(0)=0 x € [0,0.3]; h= 0.1 


usando os métodos do exercício 


12.29 - Dado o (p.v.i.): 
2yy" — 4ry? + 2(senz)yt = 6 


y(1)=0 
y(1) = 15 
a) reduza-o a um sistema de equações de primeira ordem, 
b) resolva o (p.v.i.) dado, usando um método de Runge-Kutta de ordem 2, a sua escolha. 


12.30 - Resolva o problema de valor inicial de terceira ordem: 


ay!!! o q2y” + (y)2y = 0 


y(0)=1 
y' (0) =2 
y” (0)=3 


usando o método previsor dado por (12.24), no modo P(EC)E. 
12.31 - Resolva o problema de valor inicial de segunda ordem: 


y” —-3y +2y=0 


usando os métodos do exercício 
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12.8 Problemas Aplicados e Projetos 


12.1 - Um projétil é lançado para o alto contra a resistência do ar. Suponha que a equação do movi- 
mento é dada por: 


dt m 


Se 5 = 2 e v(0) = 1, determine o tempo necessário para que o projétil alcance sua altura máxima, 
resolvendo o problema de valor inicial pelo método previsor-corretor: 


P : Yn42 = Ya + hifa a 3fn41] 


C: Yn+2 = Yn + Bfn + 4fny1 + fn+2] 


no modo P(EC)E. Obtenha os valores iniciais necessários pelo método de Taylor se ordem 2, ou pelo 
método de Heun. Considere h = 0.01. 


12.2 - Um corpo com uma massa inicial de 200kg é acelerado por uma força constante de 200N. A 
massa decresce a uma taxa de 1 kg/s. Se o corpo está em repouso em t = 0 encontre sua velocidade ao 
final de 50s. Sabe-se que a equação diferencial é dada por: 


dv 2000 


dt 200-t' 
Resolva o problema usando: 
a) método de Euler, 
b) método de Euler melhorado, 


c) método de Nystrom. 
Observação: A solução exata desse (p.v.i.) é: 


2 
v = 200010g enl , 


de modo que v(50) = 575.36. 


12.3 - Suponha que o corpo descrito no problema[12.2 está sujeito a uma resistência do ar igual a duas 
vezes a velocidade. A equação diferencial agora é: 


dv 2000 — 2v 


dt 200-t 


Se o corpo está em repouso em t = 0, a solução exata é v = 10t — 40t2, de modo que v(50) = 437.50. 
Resolva o problema numericamente usando um método de Runge-Kutta de ordem 4. 


12.4 - Considere o conjunto massa-mola dado na Figura 12.2. 
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i m P(o 
b ` > 
ar Ż 
Figura 12.2 


A equação diferencial que descreve o sistema é: 


du(t) 


M 
dt 


+bo(t) = F(t), 
onde v(t) é a velocidade no instante t > 0. Assuma que: 
ti=ih, 1=0,1,...5; h=04; 
v(0)=0m/s, b=3Kg/s, M=1Kg, F(O=IN. 
a) Calcule v(2) pelo método de Euler. 
b) Calcule v(2) pelo método de Taylor de ordem 2. 


c) Calcule v(2) pelo método previsor-corretor dado no item b) do exercício 


d) Sabendo que a solução exata é dada por: 


faça uma tabela comparando os resultados obtidos nos itens a), b) e c) com a solução exata. 


12.5 - A taxa de fluxo de calor entre dois pontos de um cilindro aquecido em uma das extremidades é 
dada por: 


onde À é uma constante, A é a área da seção reta do cilindro, Q é o fluxo de calor, T é a temperatura, t é 
o tempo, e x é a distância até a extremidade aquecida. Como a equação envolve duas derivadas, podemos 
simplificar a equação dada assumindo que: 

dT 100(L — «)(20 — t) 


dt 100 — xt i 
onde L é o comprimento do cilindro. Combinando as duas equações, obtemos: 


dQ q IOU — 2)(20 — t) 


dt 100 — zt 


Utilizando o método de Runge-Kutta de quarta ordem, calcule o fluxo de calor det = Os até t = 2s 
em passos de 0.01s. Adote À = 0.3cal.cm/sCº, A = 10cm?, L = 20cm, x = 2.5cm, e como condição 
inicial, Q = 0 emt = 0. 
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12.6 - Um paraquedista em queda livre está sujeito à seguinte equação: 


dv c 
dt == Ae e , 
onde m é a massa do paraquedista, g é a aceleração da gravidade, 

Supondo que no instante to = 0, o paraquedista salte de um avião com velocidade vertical vo = 0, 
determine, usando o método de Euler com passo de 0.01s, a velocidade do paraqguedista nos instantes de 
tempo: 2,4,6 e 8s em m/s. 


12.7 - Numa reação química, uma molécula de um reagente A combina-se com uma molécula de um 
outro reagente B para formar uma molécula de um produto C. Sabe-se que a concentração y(t) de C, no 
tempo, é solução do seguinte (p.v.i.): 


y = k(a—y)(b- y) 


onde k é a constante de reação, a e b são, respectivamente, a concentração inicial do reagente A e B. 
Considerando os seguintes dados: k = 0.01,a = TOmilimoles/litro e b = 50milimoles/litro, determine 
a concentração do produto C sobre o intervalo [0,20], usando o método de Heun, com h = 0.5, e compare 
os resultados obtidos com a solução exata: 


350(1 — e-®2t) 
yt) = 7 — 5e 02t 


12.8 - Para um circuito simples RL, a lei de voltagem de Kirchoff, exige ( se a lei de Ohm vale), que: 


po + Ri 0 

Ee p= 

dt i 

onde i é a corrente, L é a indutância, e R é a resistência. Sabendo que i(0) = 107? e considerando 
que L = R = 1, resolva o problema usando um método numérico à sua escolha, obtendo a solução com 
precisão de 1074. 


12.9 - Em contraste com o problema anterior, resistores reais podem não obedecer a lei de Ohm. Por 
exemplo, a queda de voltagem pode ser não linear e a dinâmica do circuito é descrita por: 


pe (dio Jr-o 
dt I I Di 
onde todos os parâmetros são definidos como no problema anterior, e I é a conhecida corrente de re- 


ferência. Considere I = 1. Resolva então o problema para i como função do tempo usando as mesmas 
condições especificadas no problema anterior. 


12.10 - O estudo sobre o crescimento da população é importante para uma variedade de problemas de 
engenharia. Um modelo simples, onde o crescimento está sujeito à hipótese de que a taxa de variação da 
população p é proporcional à população num instante t, isto é: 


d, 

dP op. 
dt 

onde G é a taxa de variação (por ano). Suponha que no instante t = 0, uma ilha tem uma população de 
10000 habitantes. Se G = 0.075 por ano, utilize o método de Euler para prever a população em t = 20 
anos, usando comprimento de passo de 0.5 ano. 
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12.11 - 4 resposta y(> 0) de uma certa válvula hidráulica sujeita a uma entrada de variação senoidal 


é dada por: 
dy y? 
r= al D| T= =0to-0. 
dt / ( sen2t J’ cepa q 79 


Deseja-se obter a solução numérica desse (p.v.i.) usando um método numérico de ordem 3. Pergunta- 
se: o algoritmo de Taylor pode ser usado para obter a solução desse (p.v.i.)? Se possível resolva-o pelo 
algoritmo de Taylor de ordem 3, caso contrário use o método de Runge-Kutta de ordem 3. 


12.12 - À corrente i num circuito LR num instante t qualquer depois que uma chave é ligada em t = 0 
pode ser expressa pela equação: 


di _— (Esenwt-— R) 

dt L 
onde E = 50 Volts, L = 1 Henry, w = 300, R = 50 Ohms e a condição inicial é que i(0) = 0. Resolva 
numericamente o (p.v.i.) por um método de Runge-Kutta de ordem 3 e compare sua solução com a 
solução analítica: 


E 
i = za sen wt — wLcos wt + wLe PL. 


onde Z = y R2 + w? L2. 


12.13 - Uma quantidade de 10 kg de um certo material é lançado em um recipiente contendo 60 kg de 
água. A concentração da solução, c, em percentagem, a qualquer instante t é expressa como: 
d k 
(60 — 1.2120) = (200 — 14c)(100 — 40) , 
dt 3 
onde k, o coeficiente de transferência de massa, é igual a 0.0589. A condição incial é que em t = 0,c= 0. 
Determine a relação entre c e t usando um método de Runge-Kutta de ordem 2. 


12.14 - A equação de Van der Pol, da eletrônica, é: 
y" +0- yy +y, 


com condições iniciais: y(0) = 0.5 e y'(0) = 0. Obtenha o valor de y, y', y” em t = 0.4 usando um método 
de Runge-Kutta de ordem 2. 


12.15 - Um sistema simples em vibração tem uma massa sujeita ao atrito de Coulomb, de modo que a 
equação de seu movimento é: 
—A, y >0 


n 2 ls 


onde A é uma constante, e y(0) = 3, y(0) = 0. Considerando m = 1,n = 0.8 e A = 2 e usando um 
método de Runge-Kutta de ordem 3, obtenha o valor de y em t = 5 segundos, com precisão de 1072. 


12.16 - Engenheiros ambientais e biomédicos precisam frequentemente prever o resultado de uma 
relação predador-presa ou hospedeiro-parasita. Um modelo simples para esse tipo de relação é dado pelas 
equações de Lotka- Volterra: 


dH 
= ES H — d, PH 
dt gı 1 , 
dP 

= —dP+gPH. 


dt 
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onde H e P são, respectivamente, por exemplo, o número de hospedeiros e parasitas presentes. As 
constantes d e g representam as taxas de mortalidade e crescimento, respectivamente. O índice 1 refere- 
se ao hospedeiro e o índice 2 ao parasita. Observe que essas equações formam um sistema de equações 
acopladas. Sabendo que no instante to = O, os valores de P e H são , respectivamente, 5 e 20, e que 
gı = 1, dı = 0.1, g2 = 0.02 e d2 = 0.5, utilize um método numérico para calcular os valores de H e P de 
O até 2s, usando passo de 0.01s. 


12.17 - As equações: 


descrevem a trajetória de um pato nadando em um rio e tentando firmemente chegar à posição t. Veja 
Figura 12.4. 


S 


t (1,0) y 
Figura 12.4 


O pato parte de s, de modo que y(0) = 1 e z(0) = 0. 


Calcule a trajetória do pato até t = 0.2 usando o par PC no modo P(EC)2, onde o previsor é o 
método de Euler e o corretor a regra do trapézio. Considere h = 0.1,0.01,0.001. Quantas casas decimais 
você pode garantir que estão corretas? 
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Capítulo 13 


Solução Numérica de Equações 
Diferenciais Parciais 


13.1 Introdução 


Um modelo matemático é uma representação, idealizada e muitas vezes simplificada, da natureza. 
Quando derivado de maneira criteriosa, sua solução simula propriedades dos processos naturais envol- 
vidos, tais como velocidade e pressão no escoamento de um fluido, temperatura na previsão do tempo, 
trajetória de um satélite artificial, etc... Assim, as soluções das equações de um modelo, devem apresentar 
um comportamento compatível com as propriedades do problema modelado, não sendo possível, na mai- 
oria dos casos, justificar a utilização de hipóteses simplificadoras (tal como linearidade) que permitam a 
determinação de uma solução exata. Daí a necessidade da procura de soluções numéricas, ou aproximadas. 


A importância da modelagem matemática cresceu muito nos ultimos anos porque a análise detalhada 
de um modelo e suas propriedades permite um melhor entendimento do evento modelado e, mais do que 
isso, permite a simulação de mudanças nos parâmetros do modelo e a respectiva análise da respectiva 
resposta, que não seriam possíveis na situação real. Por exemplo, no projeto de um carro, alterações na 
forma resultam em modificações no comportamento aerodinâmico, de cuja análise obtem-se um indicador 
dos ganhos e/ou perdas em performance; a localização ideal da asa de um avião em relação ao casco pode 
ser obtida pela resposta à simulação matemática das equações da aerodinâmica, e até a melhor política 
de vacinação contra doenças transmissíveis, tipo sarampo, podem ser decididos com base em modelos 
matemáticos. A economia de tempo gerada por esta maneira de projetar um produto, ou tomar decisões, 
é clara, diminuindo sensivelmente o número de protótipos ou modelos em tamanho reduzido a serem 
construídos e ensaiados. No projeto de equipamentos complexos, o mínimo que a simulação através da 
modelagem matemática coopera é na eliminação de casos triviais ou impossíveis, fornecendo um guia 
seguro para a seleção dos casos a serem ensaiados em modelos de escala reduzida ou para a construção 
de protótipos. 


Como virtualmente todas as áreas em matemática aplicada o principal objetivo das equaçés diferen- 
ciais é o de modelar matematicamente eventos da natureza nas mais diversas áreas de aplicação. Um 
modelo com várias variáveis independentes envolve necessariamente derivadas com respeito a cada umas 
dessas variáveis ou derivadas parciais, sendo portanto denominado uma equação diferencial parcial ou um 
sistema de equações diferenciais parciais. 


Resumindo as idéias apresentadas acima o processo de simulação é constituído de três partes nitida- 
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mente distintas: A fase de modelagem, isto é a construção de um conjunto de equações matemáticas que 
reputamos representar os fenômenos e os processos modelados. A segunda fase de solução desse conjunto 
de equações, normalmente utilizando técnicas de discretização numérica e um computador e finalmente a 
fase de interpretação dos resultados face às características do problema original. Esse é um processo com- 
plexo que exige do profissional um conjunto bastante amplo de habilidades; exige um bom conhecimento 
de engenharia para os ajustes finos do modelo desprezando complicações que não são fundamentais, um 
bom conhecimento de métodos numéricos para selecionar aquele que melhor adapta-se ao problema e 
finalmente um bom faro de detetive para analisar os resultados e interpretá-los à luz das restrições e 
características do problema. Este capítulo trata exclusivamente da segunda fase desse processo. 


É claro portanto que a solução do modelo matemático, ou seja, das equações representantes desse 
modelo, é fundamental para a compreensão do fenômeno modelado. Este é o papel da discretização das 
equações parciais, uma vez que, como já dissemos, uma solução analítica nem sempre está disponível; 
ou ela tem uma forma não prática ou é impossível de ser obtida. Assim os métodos numéricos são 
amplamente usados para a aproximação dessas soluções. A essência dos métodos numéricos está na re- 
presentação discreta (finita) do problema que, em geral, é originalmente modelado como um contínuo. 
Essa discretização é que viabiliza o uso dos computadores no tratamento numérico das equações diferen- 
ciais. 


O objetivo deste capítulo é apresentar uma introducao à solução numérica de equações diferenciais 
parciais, através da discretização por diferenças finitas, enfatizando os principais conceitos com vistas às 
aplicações práticas. Nos restringiremos aos casos das equações parabólicas e elípticas, por serem mais 
adequados para a solução por diferenças finitas. No entanto, equações hiperbólicas também podem ser 
resolvidas por diferenças finitas, mas nesse caso temos que ser mais cuidadosos devido ao aparecimento 
de singularidades nas soluções. 


Por razões práticas e talvez também didáticas é costume na literatura classificar as equações diferenci- 
ais parciais em tres grupos distintos: Equações Parabólicas, Equações Elípticas e Equações Hiperbólicas. 
No caso de equações de segunda ordem em duas dimensões da forma: 


alz, Y)Uzz a b(x, YU Uay + c(a, Y)Yyy $ d(x, y, Ux; Uy, u) m 0 , (13.1) 


onde uy denota a derivada de u em relação à variâvel x e a,b,c e d são funções conhecidas, a classificação 
é feita em função do sinal do discriminante: A = b? — 4ac. 


1. A = 0 - Equação Parabólica, 
2. A <0 - Equação Elíptica, 
3. A > 0 - Equação Hiperbólica. 


É claro que, como, a,b e c dependem de z, y, A também depende e portanto o sinal de A pode variar 
para diferentes valores de x e y, e nesse caso a equação muda de tipo no domínio de definição. De forma 
que é perfeitamente possível que uma mesma equação seja de um, dois ou mais tipos dependendo da 
região do domínio considerada. 


A classificação acima pode em princípio parecer irrelevante, mas de fato ela é de extrema importância, 
tanto do ponto de vista prático das aplicações quanto do ponto de vista da solução numérica. Na área 
de aplicações temos, por exemplo, que as equações elípticas são adequadas para modelar problemas de 
equilíbrio, as equações parabólicas problemas de difusão e as equações hiperbólicas problemas de con- 
vecção. Portanto a classificação constitui-se em um teste da adequação do modelo ao problema. Já 
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no contexto de solução numérica, sabemos da teoria matemática das equações diferenciais parciais, que 
as equações parabólicas e elípticas apresentam soluções altamente regulares, enquanto as equações hi- 
perbólicas podem apresentar soluções singulares. Essa informação pode ser crucial no desenvolvimento 
de um método numérico. 


13.2 Equações Parabólicas 


Nesta seção apresentamos os métodos mais conhecidos para solução de equações parabólicas. Essas 
equações aparecem no modelamento de processos conhecidos como de difusão. Por exemplo, a distribuição 
de temperatura em uma barra de metal cujas extremidades são mantidas a temperaturas conhecidas e 
termicamente isolada ao longo do comprimento, veja figura, é descrita pela equação do calor: 


Ut = QUgrg - (13.2) 


COLOCAR FFIGURA 13.1 
Supomos que a barra tem comprimento L, coincide com o eixo x e tem uma das extremidades localizada 
na origem do eixo x. Portanto a temperatura u(x,t), além da equação (13.2), deve satisfazer as seguintes 


condições de fronteira: 
u(O,t) = Ta, wuLt) = Th, t>0. (13.3) 


A equação justifica-se assumindo que a barra é feita de um material homogêneo, de forma 
que a temperatura numa secção transversal ao eixo x seja constante. Podemos então considerá-la como 
unidimensional e portanto a distribuição de temperatura será uma função da posição x e do tempo t. É 
claro que se quisermos levar a espessura da barra em consideração basta introduzir mais uma variável e 
teremos então a equação do calor em duas dimensões: 


uu = A Uza + Uyy) - (13.4) 


que não apresenta muito mais dificuldades de solução do que a versão unidimensional. Obviamente as 
condições de fronteira devem ser modificadas para adequarem-se à geometria do problema. 


Voltando ao problema unidimensional note que a distribuição de calor ao longo da barra depende 
claramente de qual é a temperatura no instante inicial em que começamos nossa observação. Isto é 
traduzido matematicamente em uma condição, chamada condição inicial que normalmente expressamos 
da forma: 

u(x,0) = y(x), O<r<L, (13.5) 


onde y(x) é uma função conhecida. 


A equação (13.2), juntamente com a condição inicial (13.5) e as condições de fronteira (13.3) formam 
um problema de equações diferenciais parciais para o qual buscamos uma solução. O leitor poderá 
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facilmente constatar consultanto um livro de matemática aplicada, por exemplo (citar o livro do Djairo), 
ou ([?], página 100) que a solução do problema acima é: 


20 — Ta du 
u(x,t) = Ta + (Th Ts + 2, ea ezp ( dass ) sin (2) 


L e n L? 
(13.6) 
$ EN E (=) (13.7) 
= n p L2 L 2 iè 


onde 


Cn = É wosa (5) dz . 


O leitor deve estar se perguntando, se temos a solução analítica do nosso problema o que mais resta 
a fazer? A resposta a esta pergunta é: de fato nosso problema modelo permite uma solução analítica 
em forma de série de potências, por ser um problema muito simples. Mas este não será sempre o caso. 
Existem problemas para os quais uma solução analítica não é possível. Para dar um exemplo basta fazer 
a em uma função de x ou t e as coisas se complicam consideravelmente. Só uma solução numérica 
será possível nesse caso. 


Na discução acima procuramos, de maneira um tanto concisa, situar o leitor diante do problema de 
modelagem e a necessidade de solução numérica da equação diferencial resultante. Passaremos a seguir a 
discutir as técnicas numéricas que permitem a obtenção de uma solução. Com esse objetivo introduzimos 
brevemente a aproximação das derivadas de uma função de uma variável, por diferenças finitas. 


Diferenças Finitas 


A idéia geral do método de diferenças finitas é a discretização do domínio e a substituição das deriva- 
das presentes na equação diferencial por aproximações envolvendo somente valores numéricos da função. 
Na prática substitui-se as derivadas pela razão incremental que converge para o valor da derivada quando 
o incremento tende a zero. Dizemos então que o problema foi discretizado. Quando o domínio tem mais 
de uma variável, a idéia acima é aplicada para cada uma delas separadamente. 


Seja zo um número real pertencente ao domínio em questão e h um número positivo. Definimos malha 
de passo h associada a £o como o conjunto de pontos 


vi = vo ih, += 1,2,... 
Nos pontos dessa malha serão calculadas aproximações de uma função y(x) e suas derivadas. 
A ferramenta matemática básica no cálculo de aproximações para as derivadas é a série de Taylor 


que relaciona valores da função e suas derivadas num ponto x com valores dessa mesma função numa 
vizinhaça de x, ou seja com y(x + h). Se y(x) tem derivadas até a ordem n +1 em x, obtemos: 


yrth) = dota) + GU) A TU (O) + 
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o último termo da expressão acima representa o erro da aproximação de y(x + h) pelo polinômio (na 
variável h) de grau n. 


Se n = 1 em (13.9) teremos a fórmula progressiva que utiliza a diferença progressiva (Ay(a)) e seu 
erro, ou seja: 


y(z) = E 5 y"(6) 


II 
| 
> 
e 
=~ 
8 

“— 
| 
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= 
SS 
DA, 
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De modo semelhante, tomando —h em (13.9), ainda com n = 1, obtemos a fórmula regressiva que 
utiliza a diferença regressiva (Vy(x)) e seu erro, ou seja: 


y(z) = E EN. 


1 h 
= zys) T 23 (£). 


Fazendo agora, n = 2 em (13.9) com h e —h, respectivamente, temos 


2 3 
yle +h) = yla) + hyle) + Ziu" la) + iE) 


2 3 
ylz h) = yla) — hy (a) + Ël) - le) 


Subtraindo a última expressão da penúltima obtemos a fórmula centrada que utiliza a diferença central 
(ôny(x)) e seu erro, ou seja: 


1 h? AA 
ap nulo) + rY (é). 


ondeée(z—h,x+h). 


Quando se fizer necessário deixar claro o passo h para o qual um operador está sendo utilizado escre- 
veremos: ôn, 0%, An, Vn, caso contrário o indice h será omitido. 


Erro e Ordem de Aproximação de Uma Fórmula de Diferença 


Seja F(x) uma fórmula de diferença para aproximação da derivada de ordem q de uma função y(x) 
com erro E(x). Então: 
Da) = Fla) + E(a). 
Dizemos que a fórmula F(x) é de ordem p se E(x) = h?R(x), onde R(x) não depende de h. Nesse caso 


usamos a notação E (x) = O(h?). Essa notação significa que limp-.0 i ) é uma constante finita. 
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Por exemplo, no caso da fórmula centrada temos que: 


y(x + ue =). Ela) = Pre 


F(x) = 
de forma que essa fórmula é de segunda ordem. 


Seguindo as mesmas idéias podemos estabelecer uma expressão para o cálculo aproximado da segunda 
derivada. Tomando n = 3 em (13.9) com h e —h obtemos: 


2 3 4 
uth) = ya) + hyfe) + ia) + Fw") 4 EO), 


2 3 4 
Ne) = yla) - hy'(e) (0) Ele) + Oe). 


Somando estas duas últimas expressões e isolando y” (x) temos: 
2 


Hh | h h? h 
ya) = HEEMWEE EaR yla) + EOE 


onde é € (x — h, x + h). 


As fórmulas de diferenças finitas em uma dimensão obtidas acima, podem agora ser utilizadas em cada 
variável para gerar aproximações para as derivadas parciais de uma função de várias variáveis. Assim, 
temos as seguintes fórmulas: 


progressiva 
k) — t k 
u(x,t) = Lii w z Ute(t,6) 
1 k 
= dra, t) — zulo) ; t<C<t+k). (13.10) 
regressiva 
= — k 
u(x,t) = se att E uale, 0) 
1 k 
= E Veia, t) + zeul) ; (t-k<¢<t). (13.11) 
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central 
ulz + h,t)— u(x- h,t) Rk? 
t = t 
= u= a Cer 
= 2h xu T, 6 Uxrrx y ? T T é 


u(x + h, t) — 2u(x,t)+ ulz —h,t) R? 


Uselz,t) = h2 12 
ias h? 
= Só u(r,t) — —Ugrrr(E, t), (r—h<é<rx+h). (13.12) 
h2 12 
u(x,t + k) — 2u(x,t)+ulz,t— k) k? 
La k? 
= 72% ulz, t) = qaul C) 7 (t -h< C<t++ h) y 
u(x + h,t+ k)— u(x +h,t—k)-— u(x —h,t+k)+ulz-—h,t-— k) 
Uzt(z, t) = 


4hk 
h? k? 
r GE 41) ii 


O(h? +k’), xz— h< i2 < x+h, e t-k<GO<t+k. 


onde denotamos por u(x,t) a derivada parcial da função u com relação a t e por Aru(x,t) a diferença 
progressiva de u na variável t. 


O Problema de Dirichlet 


Em aplicações, uma forma mais comum de ocorrência de equações parabólicas é a forma: 


u—glr bue = r(xtiuuy), a<e<be O<t<T, 
u(x,0) = y(x), a<r<b, 
(13.13) 
ulat) = f(t), 0<t<T, 
u(b,t) = g(t), 0<t<T. 


que é chamado de Problema de Dirichlet. 


Teorema 13.1 - Se g(x,t) é contínua e limitada e r(x,t,u, Ux) é monotonicamente decrescente em u, 


então existe uma única solução para (13.13). 
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Prova: A prova deste teorema pode ser encontrada em .... 
Para mais detalhes sobre a teoria geral de equações parabólicas ver Friedman [?] e Bernstein [?]. 


O modelo fundamental das equações parabólicas é a equação do calor: 


ut — (Lua = r(x,t), alxz,t)>0, O<r<L, O<t<T, (13.14) 


u(x,0) = y(x) O0<xrz<L condição inicial, 


u(O,t)=f(t), 0<t<T, 


uLD=9(), 0<t<T, ) Rondo a entea 


É importante lembrar que no caso das equações parabólicas, a solução num ponto interior depende 
de toda a condição inicial. Além disso, o operador parabólico regulariza a condição inicial, ou seja, num 
ponto interior (t > 0), mesmo que bem próximo da condição inicial (t = 0), a solução é completamente 
suave (regular), mesmo que, por exemplo f(0) Æ (0). A mesma observação é válida próximo de x = L. 


Discretização 


As técnicas de solução de equações parabólicas serão apresentadas para o problema modelo da equação 
do calor, dado por (13.14), com a(x,t) constante e r(x,t) = 0. 

Consideremos, então, o problema de Dirichlet dado por e as condições iniciais e de fronteira. 
Dividindo o intervalo [0, L], da variável espacial x, em N partes iguais de comprimento h, temos os N +1 
pontos x; = ih,i = 0,1,...,N, onde h = + e, dividindo o intervalo [0,T], da variável tempo t, em M 
partes iguais de comprimento k, temos os M + 1 pontos t; = jk,j = 0,1,...,M, onde k = a. Assim 
vamos obter uma aproximação da solução nos pontos (x;,t;) da malha, como mostra a Figura 13.2: 


Figura 13.2: Domínio da equação e respectiva malha. 
Vamos denotar por u; j a solução exata no ponto (x;,t;) e por U; ; um valor aproximado de ui. 


13.3 Métodos de Diferenças Finitas 


Método Explícito 


Usando diferenças centradas de segunda ordem na variável espacial para aproximar a derivada de 
segunda ordem obtemos: 


Ui-1,j — 2Ui j + Uma, 


E =D Dao (13.15) 


Ugzg(Ti, tj) = 
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e usando agora diferenças progressivas no tempo para aproximar a derivada de primeira ordem produzimos 
a aproximação: 

Ui j+1 — Us; 

J+1 ij 

utli, tj) = k = AU, « 


Substituindo essas aproximações em (13.2), obtemos a equação aproximada: 


Ui j+1 — Ui Ui-1,j — 2Ui j + Uma, 
DR =q n2 3 (13.16) 
ou seja, 
Urija = Ui, + o(U;-1, = 2U,j + Ui); (13.17) 


onde o = ka/h2. 


Assim, conhecidos os valores U; 1,;,Ui;j e U;,1,j calculamos U; j+1 explicitamente, sem qualquer 
complicação suplementar (ver Figura 13.3): 


Figura 13.3: Discretização e correspondente molécula computacional do método explícito. 

A molécula computacional é uma tradução gráfica da fórmula (13.17), pois ela estabelece a relação 
de dependência existente entre o valor no ponto (i, j + 1) e seus vizinhos. Note que no caso do método 
explícito o ponto (i, j + 1) depende apenas dos pontos (i — 1,5), (i,j) e (i+ 1,3) todos do nível anterior 
e daí a palavra explícito. Observe também na Figura 13.3 que, como os valores sobre a linha j = 0 são 
conhecidos (dados iniciais), é possível calcular os valores da linha j = 1 a menos do primeiro e do último, 
mas esses dois valores são dados exatamente pelas condições de fronteira completando assim o cálculo 
da linha j = 1. Tendo a linha j = 1 procedemos de maneira análoga para calcular a linha j = 2,.... 
Ilustraremos essas idéias através de um exemplo. 


Exemplo 13.1 - Calcule a primeira linha de soluções da equação a seguir, com o = E ek= dr 
Us = Use O0O<xr<1, O<t<T, 
u(x,0) = a(l-r), 0O<r<l, 
(13.18) 
u(O,t) = 0, O<t<T, 
u(Lt) = 0, O<t<T, 
cuja solução exata é: 
Wp = RC ai (13.19) 
ue mê (2n + 1)’ P 
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Solução: Como o A a=lek dy temos que h = l e portanto £o = 0,71 E „T2 3 is=le 
to=0,t a to E -... Da condição inicial vem que: 
uoo = u(xo,to) = u(0, 0) = o(1 = 0) =0= Uoo ; 
1 1 1 2 
uio u(z1, to) ulz» ) 34 3) 9 10 » 
2 2 2 2 
u20 u(z2, to) “ls, ) 3! 3) 9 20 » 
“uso = ulzs,to) = u(1,0) = 1(1 — 1) = 0 = U30 . 
Das condições de fronteira deduz-se que: 
1 
uo = u(zo,tı) = u(0, 57) = 0 = Un, 
E T ET E sd 
u31 = U3 t1) = Ui pg) T = U31. 
Usando o método explícito: 
5 
Ui = u(x, tı) = 0.1861023 ~ U11 = Uio Eg a(Uoo — 2U10 a U20) = 27 = 0.1851852 , 
5 
u21 = u(ga,t1) = 0.1861023 ~ U21 = Uso a> a (Uio — 2U20 = U30) = 27 = 0.1851852 . 


Erro de Truncamento Local 


O exemplo acima mostra claramente que a solução numérica calculada nos pontos (xı, tı) e 
(x2,t1) são apenas aproximações para o valor verdadeiro da solução nesses pontos, apesar de termos 
utilizado a solução exata no cálculo dos valores anteriores que entram na formação de U, 1 e Us 1. Dessa 
forma, o erro introduzido no cálculo acima advém única e exclusivamente da substituição das derivadas 
por diferenças finitas, ou em última instância da substituição da equação diferencial pela equação de 
diferenças. A esse erro chamaremos de Erro de Truncamento Local, que passaremos a definir preci- 
samente. 


Denotando por u;; = u(%;,t;) e por Tij O erro ocorrido no cálculo de U; ;,1 assumindo que todos 
os valores anteriores utilizados nesse cálculo são exatos, e ponderado pelo passo temporal k, podemos 
definir: 
u(£i tj+1) — Uij+i _ Ulti tj+1) = (Ui j +0o(Ui-1,; — 2049 + Ui+1,3)) 

k = k , 
onde utilizamos a equação de diferenças para substituir o valor de U; j+1. Usando agora a hipótese 
de que U; ; = u(x;,t;), Vi temos: 


ig = 


uļ(zi, tj+1) = (ulzi, tj) + ao(u(ti—1,t;) = 2u(xi, tj) + u(zi+1;tj))) 
k ? 


que, substituindo o valor de ø pode ser reescrita na forma: 


Tij = 


Ui j+1 — Ui, 


k 


Q 
= E (uj-1,j — QUi,j + Ui+1,j) + Ti - (13.20) 
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Observe que tem exatamente a mesma forma de a menos do termo do erro de trun- 
camento local, o que nos permite dizer que o bf Erro de Truncamento Local é uma medida de quanto a 
solução da equação diferencial, discretizada na malha, deixa de satisfazer a equação de diferenças. Note 
que a situação inversa, isto é, quanto a solução da equação de diferenças deixa de satisfazer a diferencial 
não é possível de ser definida, uma vez que a primeira sendo uma solução discreta não pode ser diferenci- 
ada para substituição na equação diferencial. Portanto o inverso do erro de truncamento local não pode 
ser definido. 

Uma forma mais prática para o erro de truncamento local pode ser obtida aplicando expansão em 
série de Taylor em torno de (x;, y;). 


Uijtl = u(zo ih, to + jk 4 k) 
. Ou . k? o?u . : 
= u(zo + ih, to + jk) 4 k (xo + ih, to + jk) À J DR (xo + ih, to + jk) + O(kº), 
Ui+1,j = u(zo -T ih + h, to + jk) 
f , ðu , . h? Ou . f 
= u(zo+ih,to + jk) + haz (zo + ih,to + jk) + -zzz (20 + ih, to + jk) 
h? Ou í . ht ðtu i 
l 3 353 (xo + ih, to + jk) À a pga 2° H ih, to + jk) + O(k) , 
Ui—1,j = u(zo EE ih = h, to + jk) 
oð h? 02 
= u(zo -= ih, to + jk) = h “(xo + ih, to + jk) + A N + ih, to + jk) 
dx 2 Ox? 
h’ Ou i : ht ðtu À . 5 
31 975 (TO T ih, to + jk) À ar apa T ih, to + jk) + O(k°) . 


Substituindo na equação (13.20), e cancelando os termos comuns obtemos: 
k 2 h? 3 
ut + o Um + O(k ) = Ques + Ao Vans + O(h ) + Tij š 


Daí utilizando a equação diferencial u, = aura, podemos reescrever o erro de truncamento local como: 


k h? 
Un s Uszoo + O(k?) + O(h?) = O(k +h?) . (13.21) 


Tij = 


Erro Global, Estabilidade, Consistência e Convergência 


Definimos o erro global em um ponto (x;,t;), por: 
eij = Uij— Wo 


isto é, a diferença entre a solução aproximada e a exata no ponto (x;,t;) da malha. Note que diferente- 
mente do caso do erro de truncamento local a definição de erro global não assume que os valores anteriores 
utilizados no cálculo de U; j são exatos, e portanto o erro global como o nome sugere, pode conter toda 
espécie de erro que contamine a solução incluindo o erro de arredondamento do computador. 


CAPÍTULO 13. SOLUÇÃO NUMÉRICA DE EQUAÇÕES DIFERENCIAIS PARCIAIS 440 


Então, da equação (13.17), temos: 


cj = Uij+i— uijt 


= Ui, + o(U;-1, = 2U; + Ui+1,) = [uij + o(u;-1, = QUi,j + Ui+1,j) + kti j] 


(13.22) 
= eij +0o(lei—1,j — 2ei j + eiti, j) — KTi,j 
= o(e;1,; + ei+i,j) +(1— 20)eij — krij , 
e, então 
lei,j+1] < Jol(le;-1,5] + lei+1,5l) + |1 — 20ļļe: 5| + | — kills] - (13.23) 


Fazendo E; = max(|e,,;|,0 < p < N}, Tj = max(|7,,,),0 < p < N}, supondo 1 — 20 > 0, (condição 
de estabilidade) e como o > 0 podemos reescrever a equação (13.23) como: 
leij+1| < lol2B;+ 1 — 20/E; + kllnil < Ej + k | Tig |< Ej +r. 
Portanto: 
Aplicando (13.24) recursivamente para j, j — 1,j — 2,...,1, obtemos a seguinte expressão: 
E;m < k(To + Ti+... + Ti) < (i +1)kr <Tr, 


onde T = max(T;,i = 0,1,..., M} e T = Mk é um limitante para o domínio na direção do eixo tempo, 


ver equação (13.14). 


Então, se a condição 1 — 20 > 0 é satisfeita e se 7 é de ordem pelo menos h, E;,1 — O quando k — 0. 


Observe que para provarmos que E; — 0 foi necessário assumir duas condições: T = O(h) e 1—2ø > 0. 
Essas duas hipóteses são cruciais para a conclusão do resultado, sem elas ele não pode ser provado. Essas 
hipóteses são na verdade os conceitos de Consistência e Estabilidade que passamos a definir mais 
precisamente. 


Definição 13.1 - Um método numérico é consistente com relação a uma dada equação se o erro de 
truncamento local desse método para aquela equação for pelo menos de O(h) 


Definição 13.2 - Um método numérico é estável se a equação de diferenças associada não amplifica 
erros dos passos anteriores. 


Por exemplo a equação de diferenças y;,1 = cy; é est ável se |o| < 1 e instável se |o| > 1 pois: Sejam 
p q Yj+ Yj 

yj e zj as soluções dessa equação com os dados iniciais yo €e zo = yo + €, onde € é um número pequeno. 

O leitor não terá dificuldade em mostrar que 


Yj = (a) yo, Zj = (o) zo = (0) (yo + €) = (o) yo + (0)'e . 
E portanto, 
2; — yj| = (o)€ 


? 


ou seja o erro € cometido no primeiro passo é amortecido ou amplificado dependendo de |ø]. 
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Definição 13.3 - Um método numérico é convergente num ponto (x,t) do domínio se o erro global 
E; j associado com esse ponto tende a zero quando os indices à e j tendem para infinito de maneira que 
o ponto x =i>x*h et= jx k permaneça fixo. 


O teorema de equivalência de LAX estabelece que para equações lineares as propriedades de estabili- 
dade e consistência são equivalentes àquela de convergência. (citar referencia) 

Voltando ao exemplo do método explícito observamos que desigualdade 1 — 20 > 0, pode ser rees- 
crita como o < > que é a condição para estabilidade para esse método, que será então chamado de 
condicionalmente estável. 

Chamamos atenção também para o fato de que a estabilidade é uma propriedade intrinseca da equação 
de diferenças finitas, e consiste em que esta não tenha o defeito de amplificar erros dos passos anteriores. Já 
com relação aos critérios para determinação da estabilidade, estudaremos a seguir os dois mais conhecidos: 
o de Von Neumann e o da matriz. 


Estabilidade - Critério de von Neumann 


Este é um critério simples e muito utilizado para determinar a estabilidade de um método numérico. 
Ele é baseado no princípio da superposição, ou seja na observação de que o erro global é a somatória de 
erros mais simples também chamados harmônicos. Esse processo é inspirado na expansão de uma função 
em série de Fourier. Denotando por E;, i = 0,1,...N o erro global em cada ponto ao longo da primeira 
linha t = 0 podemos escrever: 


N 
E; = > an exp(Ianih), 1=0,1,...N, 


n=0 


onde I = V-I, an = A e Nh = L, o que constitui um sistema linear com N + 1 incógnitas an e N +1 
equações, cuja matriz dos coeficientes é não singular, e portanto pode ser resolvido de maneira única para 
determinar an. Tendo representado o erro no passo inicial, para analisar sua propagação ao longo dos 
passos subsequentes basta observar a propagação de um harmônico genérico exp(1 Bih) exp(Ajk) onde 8 
é um número real e À um número complexo, ambos arbitrários. 


Portanto a estratégia do critério de von Neumann para determinação da estabilidade é a de examinar 
o resultado da propagação de um dado modo de Fourier em uma linha ou estágio subsequente j. Se houve 
amplificação desse harmônico dizemos que o método é instável, se houve amortecimento ele será estável. 


Por utilizar o princípio de superposição o critério de von Neumann só deve ser usado quando a equação 
é linear com coeficientes constantes e além disso ele ignora completamente a influência das condições de 
fronteira sobre o comportamento da solução da equação de diferenças. Geralmente, a condição de esta- 
bilidade deduzida do critério de von Neumann produz uma condição necessária para a estabilidade, mas 
não suficiente, uma discussão bastante detalhada desse problema é apresentada em [?] páginas 117-132, 


veja também o exercício (13.22). 


A seguir ilustramos a aplicação prática do critério de von Neumann utilizando-o para determinar a 
estabilidade do método explícito. Com esse objetivo vamos admitir então que exista uma solução da 


equação de diferenças (13.17) da forma: 
Di = e =(eye”, (13.25) 


e tentamos encontrar À e 5 tais que (13.25) seja de fato uma solução de (13.17). Substituimos (13.25) 
em (13.17) para obter: 


MADE = (1 — 20)U; j + o(eNelPO-D 4 eNEISCAD) 
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Assim: 
Us = (1 — 20)U; j + o(e™ PU; j + Ui) R 


Logo, eliminando os termos comuns obtem-se: 


e = (1-20)+o(e 1º + elf) 


= (1-20)+20cos5 
= 1+2o(cos5 — 1) 


à fede 
se 3 


Como o > 0 então eò = 1 — 40 sen? < 1. Assim, se eò > 0, de a solução da equação 
decairá uniformente quando j — oo. No entanto eò pode ser negativo, uma vez que À é complexo, e 
portanto teremos mais duas situações a considerar: —1 < eò < 0 a solução terá amplitude decrescente e 
sinal oscilante quando j — oo. Finalmente, se eò < —1 a solução oscila com amplitude crescente quando 
j — œ. Neste último caso é instável, enquanto que no caso anterior ela será estável. Assim, 
resumindo, para estabilidade será exigido que: 


let < 1. 
Como eò < 1 sempre, precisamos ainda impor —1 < eò, ou seja, —1 < 1 — 40 sen?5. 
Portanto: i i 
o < TET. Y8, ou seja o < 2º (13.26) 


Note que a condição (13.26) obtida pelo critério de von Neumann para estabilidade do método explícito 
é exatamente aquela que obtemos na seção anterior impondo que 1 — 20 > 0. 


Com a imposição do limitante sobre o para estabilidade, o método explícito geralmente produz apro- 
ximações satisfatórias. Porém, o < 1 é uma condição muito restritiva para o tamanho do passo na direção 
2 
t, pois esta condição significa que k < a e o esforço computacional poderá ser grande se desejarmos 
calcular a solução para um tempo T razoavelmente longo. 
Estabilidade - Critério da Matriz 


Vamos iniciar esta seção observando que a discretização explícita da equação (13.14) e respectivas 
condições iniciais e de fronteira fornece a seguinte equação de diferenças: 


Ui jti = aUi-ig + (1 — 20)U; j + 0U;-1,; i= 1,2,...N— 1, j=0,1,..., 
Ua = a dela; 

(13.27) 
Vos = f(k), j=1,2,..., 
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Introduzindo a notação vetorial: 
U; = (Uj, U25, Una) , (13.28) 


então para cada j a equação (13.27) pode ser escrita na forma matricial: 


U,w = AU; + Cj, J = 0,1,... , (13.29) 
onde A é a seguinte matriz (N — 1) x (N — 1): 
1 — 20 o 0 puk 0 
o 1—20 o sak 0 
0 o 1—20 o 
0 0 [oi 1 — 20 


e cj é um vetor de (N — 1) componentes contendo informações das condições de fronteira dado por: 


Cj = (Fk), 0, ...,0, g(jk))F : 


De maneira análoga introduzindo os vetores uj = (u(£1, tj), ..-,ul£N-1;t))T, Tj = (Tij, TN-1,j)” 
e ej = (e1,5, eia JeN-1,;)T para representarem, respectivamente, a solução exata, o erro de truncamento 
local e o erro global, e considerando (13.20), podemos escrever a equação matricial para o erro de trun- 
camento local: 


us = Au; +C tTj. (13.31) 
Subtraindo (13.29) de (13.31) obtemos a equação vetorial para o erro global: 
ej+1 = Aej + Tj á (13.32) 


Aplicando a equação (13.32) recursivamente para j, j — 1, ...0 obtemos: 


en = Ateo + Alto + ATIT +-+ Ama +; 
(13.33) 
= Air + AI + ve + ATi +T; ; 


se lembrarmos que ey = 0 por construção. Vê-se de que o erro global é formado pelo acúmulo dos 
erros de truncamento local de cada passo propagados pelas potências da matriz A. Portanto a matriz 
A tem um papel crucial na propagação desses erros e ela é chamada de matriz de amplificação. O erro 
cresce se algum autovalor de A tem módulo maior do que 1. Se todos são menores do que 1 em módulo, 
temos o erro decrescendo e portanto estabilidade. Definimos então: 


Definição 13.4 - Uma equação vetorial de diferenças da forma: 
U,, = AU; + c; n 


é estável com relação a alguma norma ||: || se e sómente se existem constantes ho > 0, ko > 0, K> 0 
e B > 0 com: 
API] < Kexp(bt) , 


sempre que 0 < t=nk, 0< h< ho e0< k< ko. Em particular se os autovetores de A são linearmente 
independentes e se seus autovalores A; satisfazem |A;| < 1+ O(k), Vi, então o método será estável. Ver 


exercício (13.10). 
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No caso particular da matriz A do método explícito (13.30) seus autovalores são dados no exercício 
(13.12) e portanto para estabilidade precisamos que: 


[=>1-40s Ra <1 
Dil = [40 sen) < 1+ O(h), 


ue pode ser facilmente mostrado implicar em o < l ou seja a mesma condição já obtida pelos critérios 
que p p 5> j j p 
anteriores. 


Note que a matriz A de um método numérico geral terá sempre seus elementos dependentes do 
parâmetro g, e portanto determinar a estabilidade desse método numérico requer a determinação dos 
autovalores de uma matriz de ordem arbitrária N cujos elementos dependem de o. Esta pode ser uma 
tarefa bastante difícil. Para tanto contamos com alguns resultados de álgebra linear que nos auxiliam na 
tarefa de encontrar limitantes para esses autovalores. Eles são os teoremas de Gerschgorin que aplicam-se 
para uma matriz A geral da forma: 


a11 ao er QIN 

a21 Goa tr Q2N 
A = 

AN1 AN2 Pe ANN 


Seja d; = Ea jai j|, temos então o primeiro teorema: 
Teorema 13.2 Seja À o maior autovalor de A tomado em módulo. Então À < maxi<i<n |dil. 


Prova: Ver [?] página 87. 
O segundo teorema pode ser enunciado como a seguir: 


Teorema 13.3 Seja r; = di — |a|. Então os autovalores de A estão na união dos discos de centro em 
lui] e raio ri. 


Prova: Ver RJ] páginas 88-89. 


Como mostrado em (13.21) o erro de truncamento local do método explícito é de ordem O(k + h?). 
Uma pergunta que surge naturalmente é se podemos obter métodos com ordem melhor. A resposta é 
positiva como veremos a seguir. 


Melhorando a ordem 


Uma tentativa de melhoria da ordem, ainda mantendo a condição de método explícito, pode ser feita 
incorporando-se mais um ponto à fórmula (13.17), ou seja, usando-se diferença centrada na variável t. 
Tem-se então a seguinte equação de diferenças, chamado Método de Richardson, e respectiva molécula 


computacional: 
ij+1 — Ui j—1 itihg — 2U;,; + Uia, 
Ui, Ui j- Uia, : do 13.34 
; i (13.34) 
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e o erro de truncamento local será: 


k2 2 


Tij = g tlean) = qa Ureca(6,t;) = OM +k’), 


portanto de ordem 2. 


A análise da estabilidade pode ser feita utilizando o critério de von Neumann. Escrevemos então: 
Ui, = eò elbi ; 
que após substituição em (13.34) e várias simplificações resulta em: 
B 


à= -4o sen? 5 + (1 + 160? sen 5) À 


Teremos sempre uma raiz de módulo maior do que 1, portanto este método é incondicionalmente 
instável. 

Uma opção para solucionar o problema da instabilidade é substituir o termo U; ; pela média dos termos 
Ui j+1 € U;,j-1, na aproximação de Urz. Vamos obter dessa forma o Método de Du Fort-Frankel: 


Diga — Vigo = quit — (Ui j+1 + Ui;-) + Uia, 
2k h2 ; 


cujo erro de truncamento local é dado por: 


k2 h2 k2 kt 
q it — Jo treze — qa Ca + o(ht + kt + 72) E 


Tij = 


Agora, se k = rh temos que o método não será consistente, melhor dizendo, o método será consistente 
com a equação: 
Ut = Urr — ar ue : 


que é uma equação hiperbólica! 

Portanto, para obtermos um método consistente, é preciso restringir k em função de h, por exemplo 
k = rh? e aí teremos um método consistente de ordem 2. O método de Du Fort-Frankel é pois condicio- 
nalmente consistente e a condição imposta é bastante restritiva. 


Analisando a estabilidade, vemos que, a partir de 


Ui j+1 — Ui j-1 = 20o (Uii, — (Ui j+1 + Uij-1) + Uia)» 


obtem-se: 
(1 + 20)U; j+1 = 20(U;+1,j + Uig) = (1 = 20)U; j—1 =0, 
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e pelo critério de von Neumann, escrevendo: 


teremos: 
(1+20)e* — 2eùo cos 6 — (1 — 20) =0 , 


cujas raízes são: 


1 +20 142º 


Temos que 1 — 40 sen? < 1, podendo ser positivo ou negativo. 
i) Se negativo: Teremos raízes complexas conjugadas e 


po pao E (1-40sen28)3 ab 


(a + Ib)(a — Tb) 40? —1 
hl = = <1 
1 +20 40º +40 +1 
ii) Se positivo: Então, 
1+2 
EA E E ooo Es 
20 +1 


Portanto o método é incondicionalmente estável. 


Este método é um método explícito de dois passos, pois exige conhecimento da solução em 2 níveis 
anteriores de tempo para a construção da solução no próximo nível. Diferentemente dos métodos de um 
nível, ele só pode ser aplicado para o cálculo da solução a partir do nível 2, exigindo que o primeiro passo 
seja calculado por meio de outro método. 


Este método constitui um exemplo claro do cuidado que se deve ter em relação ao teorema da equi- 
valência de Lax ilustrando o importante fato de que nem sempre a escolha da malha (relação entre h e 
k) é ditada pela condição de estabilidade. No caso do método de Dufort Frankel quem impõe a escolha 
da malha é a consistência e não a estabilidade. Está implícito no teorema de Lax que é preciso verificar 
não só a condição de estabilidade mas também a escolha adequada da malha. 


Como vimos, resolvemos o problema da instabilidade e criamos um outro com a consistência, este 
será sempre um dilema pois essas duas propriedades estão na maioria das vezes em conflito. Uma ma- 
neira de aliviar esse problema é considerar métodos implícitos, pois estes têm melhores propriedades de 
estabilidade, mas como veremos abaixo o custo computacional aumenta consideravelmente. 


Método Implícito 


Uma fórmula implícita é aquela em que dois ou mais valores desconhecidos na linha j são especifi- 
cados em termos de valores conhecidos das linhas j — 1, j — 2,.... Claramente, não será possível o cálculo 
direto de U; j; usualmente exige-se a solução de um sistema linear. 


Aplicando diferenças regressivas do lado esquerdo da equação e diferenças centradas do lado direito, 
obtemos: 
Uij —Uij-1 [Uia — 2Uij + Uma, 
e F 


que depois de alguma manipulação algébrica pode ser reescrita na forma: 


(13.35) 


—0Ui;-1,j + (1 +20)U;,; — CU, = Usj- para 1= 1,2, .. ,N —le J= 1,2, s.. (13.36) 
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A molécula computacional dá-nos uma idéia precisa da relação de dependência entre os diversos 
elementos da fórmula. 


Figura 13.5: Molécula computacional do método implícito. 

Observe que (13.36) forma um sistema tridiagonal de equações, e ao resolvê-lo encontramos todas as 
aproximações do estágio j. Escrevendo mais detalhadamente, o sistema a ser resolvido em cada estágio 
é: 


1+2o0 = 0 kad 0 Ui; Ui j-1 oUo, j 
O. 1 +20 =y ... 0 Usa; U2 j—1 
; ; : = ; + ; , 
0 TE —o 1 + 20 =. Un-2, Un-a,j-1 0 
0 nia 0 —0 1 +20 Un-1, Un-1,j-1 OUN 


ou na notação vetorial introduzida em (13.28): 
AU; = U; +j, (13.37) 
onde c; = (o f(jh),0,...,0,0g(jh))”, para o caso de condições de fronteira como as de (13.14). 


Podemos observar que A é uma matriz (N — 1) x (N — 1) estritamente diagonalmente dominante e 
portanto o sistema tem solução única. Além disso, a propriedade de diagonal dominância nos 
garante que pode ser resolvido por qualquer método de solução de sistemas de equações lineares, 
como os métodos dados nos Capítulos 4 e 5. 


Exemplo 13.2 - Calcule a primeira linha de soluções do problema do exercício (13.19 


Solução: Temos: 


1 
k= h 
"26º" 54 3 
1 1 2 
Com h = 3 temos zo = 0, £1 z2 773 1. 
1 1 2 
Com k = gg temos to 0, ti 54º! yo . 


Usando as aproximações Uoo, Uio, Uso, Uso, Ugo e U31, do exemplo (13.19), vamos calcular U1 e Us. 


Uio = —0Uo1 + (1 + 20)U11 — oUa: , 
Uso = —oUm E (1 E 20)U21 — o U31 A 


(1 +20) —0 Um o Uio + oUo1 
—0 (1 +20) U21 = Uso + Us ? 
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4/3 —1/6 Ui) (2/9 
—1/6 4/3 Un ) 1 2/9 ` 
Resolvendo o sistema acima obtemos: 


Um = U21 = 0.1904762. 


A solução exata é u11 = u21 = 0.1861023. 


Veja que a utilização de um método implícito como o acima é de difícil justificativa prática, uma vez 
que a precisão dos resultados não melhorou na mesma proporção do aumento do esforço computacional. 
Apresentaremos ainda neste capítulo um método implícito que apresenta erro de truncamento com ordem 
mais alta. Antes vamos calcular o erro de truncamento do método implícito para justificar os resultados 
numéricos obtidos no exemplo acima. 


Erro de Truncamento Local 


O desenvolvimento aqui segue exatamente as mesmas idéias do caso do método explícito e portanto 
repetiremos sómente os passos principais. 


Seja 7;,; O erro de truncamento ocorrido no cálculo de U; j. Então, podemos escrever: 


Uij— tiji a 
E = 3 (viij — 24,9 + Ui) Tij- 


Aplicando expansão em série de Taylor em torno de (x;,y;), obtemos, 


a + O(k?) = na + O(hº) + Ti, 
Ut o Ut = QUgrg T Q qg Varrese T T Tij- 
Assim: 
k ah? 2 3 2 


Concluímos que o método é incondicionalmente consistente e de ordem 1. 


Comparando as expressões e observamos que elas diferem apenas no sinal do termo 
Eun sendo um positivo e outro negativo. Esse fato nos motiva a considerar uma nova aproximação que 
é a média entre as aproximações explícita e implícita, na esperança de que esse termo despareça do erro 
de truncamento local, como de fato ocorre. Essa estratégia dá origem ao método de Crank-Nicolson que 
será estudado logo mais adiante. 


Erro Global 


Segue o mesmo desenvolvimento feito para o método explícito. 
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Estabilidade 


Analogamente ao caso do método explícito pelo critério de von Neumann escrevemos: 
Ui, = eò eTPi . 


Substituindo na equação (13.36) temos o seguinte desenvolvimento: 


Usj- = —0U;-,j +(1 + 20)U,j — OU, 
eòG-DelPi = geNdPED 4 (1420)U;; — ce el) 
e Ni; = -ce PU; ; + (1+ 20)U; j — oe PU; ; 
E = ate Pres (1 +20) 


—2o0 cos 6 + 1 + 20 
1+20(1 — cos 8) 


b 
= 1+4 ae. 
o sen 2 


Portanto: 
N 1 


= 1 +40 sen? 


Para a estabilidade, |eò| < 1. Mas, neste caso [e2| < 1 para todo o, ou seja, o método é incondicio- 
nalmente estável. Algumas vezes, esse fato é usado para justificar a utilização de um método implícito, 
pois sendo esse método incondicionalmente estável, não devemos nos preocupar com a amplificação de 
erros e portanto podemos utilizar uma malha menos fina para obter a solução. 

Como nos casos anteriores, a análise da estabilidade pode ser feita também pelo critério da matriz, 
aplicado à equação de diferemças, 

e; = Ae; + A'T ; 


de maneira que teremos estabilidade se os autovalores de AT! estiverem no disco unitário. Ver exercício 


(E). 


Método de Crank-Nicolson 


Este é um dos métodos mais utilizados na solução de equações parabólicas. Como no caso do método 
do Trapézio para equações diferenciais ordinárias, este método é a “média aritmética” do explícito com 
o implícito. Tomando pois a média entre as expressões (13.17) e (13.36) obtemos o Método de Crank- 
Nicolson: 


(Dig + Ui—1,j+1 — 2(Ui j + Uig) PU + Uma gua) 
2 ? 


Ua =U tT (13.39) 
ou ainda, 


Ui j+ — Ui, = a ( 
k —2h2 


Ui—1,; — 2U; j + Uia, + Ui-1,j41 — 2Ui j+1 + Uiti,j41) o 
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cuja moFecula computacional é: 


Figura 13.5: Molécula computacional do método de Crank-Nicolson. 
Podemos observar que estas equações formam o seguinte 


sistema linear tridiagonal 
AU,,1 = BU, + c; que é diagonalmente dominante: 


2 + 20 —0 0 RA 0 Urga 
o 2 +20 o sta 0 U2 j+1 
0 o 2+20 o Un-2,j41 
0 0 =0 2 +20 Una j41 
2-—20) o 0 0 Ur, aUo,j 
o 2—20 o 0 U2 j 0 
: + ; 
0 o 2—20 o UN-2,j 0 
0 0 o 2 — 20 Un-1,j OUN,j 


ou utilizando notação vetorial podemos escrever: 


AU;4 = BU, + Cj (13.40) 
Para se obter a solução em cada estágio, é preciso resolver um sistema tridiagonal. Note que, sendo 
A diagonalmente dominante, o problema discreto tem solução única. 


Erro de Truncamento Local 
Analogamente às definições de erro de truncamento local dos demais métodos definimos T; į por: 


UWjUj a 
E = apê (Wit, T Uig + Uiig + Urge — QUijpd H Uitrit) H Tig - 


Expandindo em série de Taylor em torno do ponto (x;,t;, 1 k), obtemos: 


Ui j+1 — Ui,j k i 
vinis a (F) zum + O(kÎ), 


h4 
Ui—1,j — Zui j + Uii j = ge + Jp treze +O(hê) , 
ht h? k? htk? 
Ui—1,j+1 — QUi,j+1 ne Ui+1,j+1 = h’uzz JS Jo Verre -g “rztt G gg “eseatt e O(hº) . 
Logo, 
k? ah? ak? h? k? 
Ti j 


= aq ttt 12 Uxxax 8 Uxatt a 96 Uxrrzrtt + O(hº) + O(k?) = O(h? + k?) k 
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Estabilidade 


A análise da estabilidade segue o mesmo raciocínio desenvolvido para o método explícito. Substituindo 


em (13.39) obtemos: 


1-20 sen? 
Re CE (13.41) 


a 


B 
mo PETS a, 
1+20sen24 


e concluímos que o método é incondicionalmente estável, pois |eò| é sempre menor do que 1. 


É possível provar que o erro de global satisfaz a equação vetorial Ae; = Be; 1 +7; e como A é 
inversível, tem-se estabilidade se todos os autovalores da matriz de amplificação C = ATİB estão no 


disco unitário. Ver exercício (13.15). 


Condição de Fronteira de Neumann ou com Derivadas 


Quando as condições de fronteira envolvem a derivada da função u(x, t), dizemos tratar-se de Condições 
de Fronteira de Neumann. Podemos ter uma das condições de fronteira ou ambas, com derivadas. 
Teremos então um problema como a seguir: 


Uut = Urr, 4>0, OSIL, O<t<T, (13.42) 
u(x,0) = ylz), 0O<u<L, 
t 
Dut = ft), 0<t<T, 
ox 
L.t 
Eu = g(t), O<t<T. 
Ox 


Ao discretizarmos esse problema por qualquer das técnicas anteriores teremos agora que resolver a 
questão de que os valores Uo; e Un,; deixaram de ser conhecidos, veja a Figura 13.7. 


Figura 13.7: Discretização do Problema de Neumann com inclusão de pontos fantasmas 

Note que conhecemos os valores das derivadas direcionais sobre as fronteiras x = 0 ex = Le não 
mais o valor da função como no caso da condição de fronteira de Dirichlet, de forma que devemos tratar 
esses valores (Uo, j, Un,j) como incógnitas, ou seja, nossa discretização deve incluir os valores da função 
nos pontos xy = 0 e zy = L como incógnitas. O problema é que ao escrevermos uma equação para o 
ponto xo = 0, por exemplo, no caso do método explícito obtemos: 


Uo,j+1 = 0U 1, + (1 — 20)Uo,; + oUi j ; 


que contém o ponto U..,,; que não faz parte da malha. Devemos portanto utilizar a condição de fronteira 
para calculá-lo, fazendo: 

ns ðu(0, t;) As Ur, m Us, 
= ðm — 2h É 


Ft) (13.43) 
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onde foi utlizado a discretização da derivada por diferenças centrais. A equação (13.43) pode ser reescrita 
na forma: 
VU 1;=Ui—2hf(t;), (13.44) 


e portanto o valor de U.,; pode ser substituído por (13.44) na expressão do método numérico sem 
maiores problemas. Devemos no entanto observar que a notação vetorial introduzida em (13.28) deve ser 
modificada para refletir o fato de que U,,; e Uw,; são agora incógnitas, assim: 


U, = (Uoj, Ur jo. Un)” , 


e portanto um vetor de N + 1 componentes. Certamente a matriz A da equação (13.29) deve ser de 
ordem (N + 1) x (N + 1) e ter sua primeira e última linhas modificadas. Assim a equação equivalente a 
(13.29) para o caso de condições de fronteira com derivadas é: 


U,m = AU; Z Cj, 


onde A é a matriz não simétrica: 


1 — 20 20 0 Ene 0 
o 1—20 o Ro 0 
A= : : (13.45) 
0 isto o 1—20 o 
0 R 0 20 1—20 


e cj é um vetor de (N + 1) componentes contendo informações das condições de fronteira dado por: 
cj = (2h f (jk), 0,- . 0, —2hg(jk))” . 
Já para o caso de um método implícito teremos um pouco mais de dificuldades. Consideremos o 
método de Crank-Nicolson (13.39) que pode ser reescrito na forma: 
—0Ui1,j4+ + (2 + 20)U;,j41 = oUi—1 j+1 = CU, + (2 = 20)U; j + 0U;-1,j . (13.46) 


Novamente quando à = 0 ou i = N teremos o aparecimento dos termos U—1, j+1, U—1,j, UN+1,j+1 € 
Un+1,j que não fazem parte da malha e portanto são pontos fantasmas. Da mesma maneira que fizemos 
para o caso explícito em eliminamos esses valores da equação (13.46), para obter a equação 
matricial: 

AU, = BU, F Cj , 


onde as matrizes A e B são de ordem N + 1 e dadas por: 


2+20 —20 0 nia 0 
—0 2+20 —o a 0 
A= 
0 o 2+20 o 
0 0 —do 2+20 
2-—20) 20 0 0 
o 2—20 o 0 
B= f 
0 pea o 2—20 o 
0 ios 0 20 2 — 20 


e o vetor independente c; = (2ho(f(tj+1) — f(t;)), 0,- -,0, 2ho(g(tj+1) — g(t;)))T - 


Observações: 
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a) A matriz A do método de Crank-Nicolson para problemas com condição de fronteira de Neumann 
não é simétrica, mas continua estritamente diagonalmente dominante. A perda da simetria é um 
fator de considerável complicação para a solução do sistema linear. 


b) No caso do domínio possuir uma fronteira irregular, os pontos próximos da fronteira precisam de 
tratamento específico, por meio de interpolação. Este aspecto será tratado com mais detalhe nas 
equações elípticas. 


c) É também possível encontrar na prática problemas com condições de fronteira do tipo misto, ou 
seja, uz(0,t) — ayu(0,t) = g(t). O tratamento numérico desse tipo de condição de fronteira é uma 
combinação daquele dos casos de fronteira de Dirichlet e de Neumann estudados acima. 


13.4 Problemas Não Lineares 


A maioria dos métodos discutidos anteriormente podem ser generalizados para equações lineares com 
coeficientes variáveis, ou seja, a = a(x,t) na equação (13.14). Mas encontramos algumas dificuldades 
como: 


e embora as matrizes continuem diagonalmente dominantes, o não é mais constante; 


e temos que calcular œ; j; a cada passo, e no método de Crank-Nicolson, por exemplo, precisamos de 
Qi į no ponto intermediário, para isso calculamos: 


a(zi, tj) + (xt). 
2 i 


a(Titjye) ou 


e não poderemos usar análise de Fourier para fazer a análise da estabilidade de maneira global, apenas 
localmente. 


Quando a = a(x,t,u) ou a = a(u) temos o chamado problema quase-linear, neste caso o método 
explícito pode ser usado sem dificuldades, pois sua utilização não requer a solução de equações não line- 
ares. Já para os métodos implícito e de Crank-Nicolson obtemos um sistema de equações não lineares, 
que podemos resolver por aproximações sucessivas ou pelo método de Newton, com a aproximação inicial 
calculada pelo método explícito. Na prática, no entanto, recomenda-se a utilização de métodos implícitos 
para evitar problemas de estabilidade, uma vez que estes são incondicionalmente estáveis. 


O caso mais geral de uma equação não linear parabólica é representado pela expressão: 
f(T, t, U, Ut, Ux, Ure) = 0. (13.47) 


Casos particulares importantes são representados pela equação de Burgers, onde se tem f(x, t, U, Ut, Ux, Uzr) = 
Ut + Uug — QUyyr = O e pela equação de Ritchmyer ([?]) onde f(x, t, U, Ut, Ux, Uva) = ut — (U )re = 
0, m>2. 


Um método explícito para resolver (13.47), simplesmente avalia essa expressão no ponto (x;,t;) e 
substitui a derivada em t por diferença progressiva e as derivadas em x por diferenças centrais. No caso 
em que a derivada temporal pode ser escrita de forma explícita em função das outras variáveis, ou seja 
quando a equação é da forma: 

Ut = fla, t, U, Uz, Uzr) , 
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podemos discretizá-la facilmente pelo método explícito para obter: 
Ui, ~ Uiig Um — 2Ui;; + Ui, 
2h , h 
Uma análise da estabilidade linear desse método é possível e pode ser encontrada em detalhes em [?] 
páginas 74-76. O resultado demonstrado em [?] é o seguinte: 


Ui j+1 = Ui j + (mt; Uij, 


Jx (13.48) 


Teorema 13.4 Seja f uma função satisfazendo as seguintes hipóteses: 
1. fuza 2 pi > 0 , 
2. |ful + fusl+ fuso < B» 


onde fọ representa a derivada parcial da função f com relação ao argumento À e supomos que u seja 
uma função 4 vezes diferenciável em x e 2 vezes em t. Então o método (13.48) é convergente se: 


» k 1-6k 
h<= e0<— < 
Sp ºC CS ag 
No caso em que: 

2 

82 
f(£,t, U, Ux, Uso) = (UP aa = mm — Du? ($) + ra m>2, (13.49) 

x x 


teremos 0<y=mu”le 6 = mu” + 2m(m — Dura, + mim — Dm — Dur (u,)2|. 


Observe que assumimos que y > 0 e portanto 5 > y de forma que o teorema acima impõe as condições 
de estabilidade: 


1. h< 27/8 <2 


k k 
2; z < (1—8k)/(28) ou seja Biz < (1—8k)/2 < 1/2. Usando agora que 8 > y na última desigualdade 


obtemos: 


Esse mesmo resultado poderia ser obtido por comparação com a equação linear com coefientes cons- 
tantes reescrevendo a equação (13.49) na forma 


m—l 


us = (mu Ur)a , 


e compararando com a equação com coeficientes constantes, Uut = (au), para concluir que a condição 
de estabilidade do método explícito toma a forma: 


ak mu™ik 1 
= < i 
h2 h2 2 
Isto quer dizer que para problemas não lineares a estabilidade depende, além da equação de diferenças 
finitas, da solução do problema que está sendo resolvido e portanto a condição de estabilidade pode variar 
ao longo do domínio. Para obter-se um método implícito substitui-se as derivadas da variável espacial 
por fórmulas envolvendo o mesmo nível de tempo. Um exemplo de método implícito para resolver (13.47) 
é o método de Crank-Nicolson dado por: 


Viga + Ui Uij+i — Uij MôrUijra + HôsUiy SzUijt + SzU 
f t 0 
Ti, j+4>? 2 , k , 2h , 92h2 Ro , 
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onde os operadores | e ôy estão definidos em (??). A equação acima deve ser aplicada em todos os pontos 
do domínio para os quais quer-se calcular uma aproximação, produzindo um sistema de equações não 
lineares nas variáveis U; j. Esse sistema pode ser resolvido por aproximações sucessivas ou pelo método 
de Newton, (veja Capítulo 4). 


13.5 Equações Parabólicas em Duas Dimensões 


Nesta seção consideraremos a discretização de equações parabólicas lineares em duas dimensões, da 
forma: 
Ut = QyUga + QQUyy » 


onde u,&ı e œz são funções de x,y e t; x e y variáveis espaciais e t variável tempo, ou em notação de 
operadores, 
u = Lu, (13.50) 


com L = QuUry + Q2Uyy. 


Todos os métodos discutidos anteriormente podem ser adaptados para este caso mas o esforço com- 
putacional aumenta quadraticamente, de forma que a simples adaptação não é uma solução satisfatória. 


Apresentamos a seguir alguns métodos criados para contornar esse problema, exigindo um número 
menor de operações aritméticas. 


Inicialmente supomos que a região de definição do problema seja formada pelo retângulo [0, a] x [0, b] 
do plano x —y e pelo intervalo de tempo [0, 00). Essa regi ao do plano é coberta por uma malha retangular 
com lados paralelos aos eixos, com espaçamento hı na direção x, ho na direção y e por uma discretização 
temporal com passo k. Os pontos da malha (x,y,t) serão dados por x = lh,y = Mhs e t = nk, onde 
l, m,n são inteiros. Uma função discreta definida nessa malha será denotada por Um- 


Da expansão em série de Taylor de u(x, yY, tn+1) = Ulz, y, tn +k) em torno do ponto (x,y, tn), obtemos: 


2 


k 
u(x, Y, tn+1) = ulz, Y, tn) + ku(z, Y, tn) + o uti, Y, tn) Pea (13.51) 


Observando agora que w = Lu e que L independe de t, deduzimos por diferenciação com relação a t 
que um = (Lu), = Lu, = L x Lu = L2u. Assim podemos mostrar por indução que: 


Pu 
— TP 
dp T 
Levando esse resultado em (13.51), obtemos: 
k2 
U(E Yin) = ulz, y,tn)+kLuls, y, tn) + 5L ule, y, tn) + 
k2 k? 
= (I+kL+ 3 L+ 31 L? +- Ju(x,y, tn) = exp(kL)u(z, y, tn) . (13.52) 


Avaliando a expressão (13.52) no ponto (z1, Ym, tn) obtemos a fórmula (13.53), que será utilizada na 
dedução dos diversos métodos a seguir. 


up = exp(kL)ufmn - (13.53) 
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Método Explícito 
Vamos exemplificar esta técnica usando 
L = urz + uyy = DÎ + D2, (13.54) 


ou seja, &1 = @2 = 1 e Di = ug, D2 = uy. 


A equação (13.53) torna-se: 


u”t! = exp(k D?) exp(kD3)u” 


Lm 
Como 
1 1 1 

D? = 2 4 | 6, 

e 1 1 1 
2_ 2 4 6 

Da = paldy— p t g% h) 

veja exercício (??). Então 
ni =p rosl ga. ro i ga de 13.55 


onde o = k/h2. Aqui estamos utilizando hı = h2 = h, como espaçamento nas variáveis x e y. A con- 
clusão final não será muito distinta se considarmos espaçamentos diferentes para cada uma das variáveis 
espaciais. No entanto, alertamos que essa talvez seja uma situação mais realista para aplicações práticas. 

Vários métodos explícitos podem ser obtidos da equação (13.55). Por exemplo, multiplicando as duas 
séries e em seguida considerando somente os termos de primeira ordem obtemos, 


Ulm = [L+ o(d} + 5) Um + O(K? + kh’), (13.56) 


que é o método explícito padrão envolvendo cinco pontos no nível de tempo t = nk. 
Outro método simples pode ser obtido da equação (13.55) considerando os termos de primeira ordem 
em cada uma das expansões separadamente 


ULA =(1+002)(1 + 00))ULm + OCK? + kh?), (13.57) 


Esta fórmula envolve nove pontos do nível de tempo t = nk. 


Estabilidade 


Analogamente ao caso unidimensional temos o critério de von Neumann e o critério da matriz para análise 
da estabilidade. No entanto, em duas dimensões a análise da estabilidade pelo método da matriz se torna 
um tanto complexa, pois na tentativa de generalizar o procedimento feito para o problema unidimensional 
por exemplo para a equação (??) obtemos um sistema linear U”+! = AU” + c”, onde agora, U” é um 
vetor de vetores e A uma matriz de matrizes. Se compararmos com a matriz veremos que no 
lugar dos elementos dessa matriz aparecerá agora matrizes. Este fato, complica a análise do problema de 
autovalores. 

Pela sua simplicidade e facilidade de exposição concentraremos aqui no estudo do critério de von 
Neumann que assume uma decomposição harmônica dos erros em um dado nível de tempo, por exemplo, 
t = 0. Um modo individual, representando a decomposição é então dado por: 


eelbzçlry (13.58) 
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onde 5 e y são números reais arbitrários e a = a(ß,y) é em geral complexo. Tomando essa solução nos 


pontos da malha obtemos: 
etn elpt: eU = (eps Ely; 


E portanto, essa componente do erro será uniformente limitada se: 


Jet] < 1 


para todo a. 
Se (13.58) é substituído na fórmula (13.56), o resultado eliminando-se fatores comuns torna-se 


h 
ef = 1 — 4o (s + sent.) : 


Para estabilidade [eº*| < 1 e, então 


h h 
—1 < 1 — 4o an + sen 272 <l. 
2 2 
O lado direito da desigualdade é satisfeito, e o lado esquerdo resulta em: 
1 1 


o < Sa 
2 ( sen 28k + sen 24) 4 


então temos a condição de estabilidade o < L. 

Muitas vezes a restrição imposta pela estabilidade sobre o passo temporal, torna-se muito restritiva, 
e pode levar o usuário a preferir a utilização de um método implícito para escapar dessa restrição. Na 
próxima seção apresentamos brevemente os métodos mais utilizados na prática. 


Métodos de Direções Alternadas Implícitos 


A discretização de uma equação parabólica em duas dimensões por um método implícito leva à neces- 
sidade de solução de um conjunto de sistemas de equações lineares cuja matriz tem a dimensão do número 
de pontos da malha nas variáveis espaciais, isto é se tivermos N pontos na direção x e M na direção y, a 
cada passo de tempo, teremos que resolver um sistema linear com NM equações. Esse processo pode ser 
extremamente caro do ponto de vista computacional se não levarmos em consideração a estrutura muito 
especial da matriz dos coeficientes. Por exemplo a discretização implícita equivalente a é: 


Vis = Ui t elis tU (13.59) 


ou seja, 


(1 + o(5 + SS DUSH! = Up, 


que resulta num sistema linear cuja matriz A tem no máximo 5 elementos não nulos por linha. Na 
maioria das vezes é possível arranjar as incógnitas desse sistema de tal forma que os 5 elementos não nulos 
de cada linha estejam posicionados de maneira a formar uma matriz com 5 diagonais, a principal, uma 
imediatamente acima e outra imediatamente abaixo desta, e duas outras localizadas a certa distância 
da diagonal principal. Obviamente esta é uma matriz muito especial e não devemos tentar resolver o 
sistema linear resultante sem ter essa característica em mente. A grande dificuldade é que não existem 
métodos especiais eficientes para tratar o problema com cinco diagonais, e o método de Gauss não é muito 
adequado pois ao aplicarmos o processo de triangularização elementos que eram nulos originalmente o 
deixam de ser ao longo do processo, provocando o processo conhecido como “fill in”. Já esta mesma 
dificuldade não ocorre se a matriz tiver apenas 3 diagonais; a principal e as duas adjacentes. Nesse caso 
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o método de eliminação de Gauss pode ser aplicado sem nenhuma dificuldade. A tentativa de resolver 
o problema bidimensional resolvendo-se apenas sistemas tridiagonais é materializada pela concepção dos 
Métodos de Direções Alternadas (ADI). Métodos ADI são métodos de 2-passos onde em cada passo 
apenas uma das variáveis é tratada implicitamente. No primeiro passo u, é discretizado implicitamente 
e Uyy é tratado explicitamente, no segundo passo os papeis se invertem e assim sucessivamente. O esforço 
computacional do método ADI é cerca de tres vezes o do método explícito, preço que pagamos ao utilizar 
um método incondicionalmente est'avel. 

Ilustraremos estes métodos com respeito a equação com L como em (13.54). A região a ser 
considerada consiste em R x [t > 0], onde R é uma região arbitrária fechada em IR?. Inicialmente 
tomamos R como quadrado [0 < x < 1,0 < y < 1]. 


Da equação (13.53) temos: 


ut = exp(k(D? + D3))u” 


k n 
(Di + D3) + 5(Di + D3))u 


logo, 


k k 
exp(- (Di + D3))uPt = exp(s (Di + D5)u” (13.60) 


k k A k k E 
exp(-5 Di)exp(- 5 Dô)u TS exp(5 Dijexp(5 Do)u ; 


cuja expansão e truncamento da série fornece a equação: 


1 1 1 1 
(1 — 5055) — 509 UM! =(1+ 505) + z373 )U” +O(k? + kh?), (13.61) 
este método é uma modificação do método de Crank-Nicolson em duas dimensões que é dado por: 
(1— 1o02 — Losyur = (1 + 15824 L002)U” + O(S + kh?) (13.62) 
2 o gos De SED O Í f 


Note que para obter (13.61) de (13.62) um termo da forma 3020, foi adicionado em ambos os membros 
de (13.62). 


A equação (13.61) pode ser interpretada de uma forma mais conveniente para a implementação com- 
putacional introduzindo-se um passo intermediário para “decompor” (13.61) em duas equações: 


E eE y. n+l» — 1 1,52 n 
ra 3002)U = (14500, )U (13.63) 


User = (1+ qagur 


ou seja, o passo intermediário representa uma solução na direção x e o passo final uma solução na 
direção y. 

O método decomposto com U"H" = yr+1/2 isto é o passo intermediário é interpretado como 
um “meio” passo, foi introduzido por Peaceman e Rachford [?] e é conhecido como método de Peaceman 
e Rachford. 

Um método decomposto com precisão mais alta pode ser obtido da equação substituindo D? 
e DŻ por, (veja exercício (??)). 


2 ô 2 ô 
D = S e D = CS A sas 
1T eUF K) 2T RQ+ G) 
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e expandindo para obter: 


1 
2 


Loo) 
20" 6 


[1 (o Saz aJU" = [14 lo + SA lo SU” + O(k + khº), (13.64) 


que pode ser decomposto em duas equações: 
(= de= our 
G= = (1 


este método foi obtido por Mitchell e Fairweather [?]. 

As equações e são exemplos de métodos envolvendo a solução de sistemas tridiagonal 
ao longo das linhas paralelas aos eixos x e y respectivamente. Estes são os métodos ADI. 
As fórmulas e podem ser decompostas de uma outra maneira sugerida por D'Yakonov 


Dou” 


sue (13.65) 


— 

| 

T 
[o] [al o] Lud 
— 

q 

| 
oro 


[2] 
1 (1-JooJUMM = (1+ 4082) (1+ $082)U” 
(1- 06 )U = Ur, 
i ( (1— (o — DUNA = (1+5M0+ BI + ilo + G)oBU” 
(salpa = um 
respectivamente. 


Finalmente, Douglas e Rachford [?] formularam um método ADI que é dado na forma decomposta 
por: 


* 


(1—oôZ)U" t] = (14055))U” 
(1 — oð2)U”T ER ad 


= 


e é conhecido como o método Douglas-Rachford. Eliminando-se U"+” temos a fórmula: 


(1 — að2)(1— að )U”HI =(1+ 25 JU”, 
que pode ser decomposta, de acordo com o método de D'Yakonov, em: 
(1-00)UM = (1+ CORA JU, 

sad UR = yt”, 


Usando o método de von Neumann, mostra-se a estabilidade, dos métodos ADI apresentados nesta 
seção, para todo valor de o > 0, ver exercício (13.25). 


Método Localmente Unidimensional 


Vamos ilustrar os métodos localmente um-dimensionais (LOD) resolvendo a equação 


Ut = Uze + Uyy, 


que pode ser reescrita como o par de equações 


aqu = Urr € aut = Uyy- (13.66) 
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A idéia é portanto, aproximar a solução de um problema em duas dimensões resolvendo dois proble- 
mas unidimensionais que localmente representam o problema original. As discretizações explícitas mais 
simples dessas fórmulas são: 


1 fumê - U” Da 

2 k/2 — 
1 Unt! = Etta = e 
2 k/2 h2 


que pode ser reescrita na forma compacta como: 
Uta = (1+08?)U” e UM = (1+ 002)U”t?, (13.67) 
e eliminando U”+? temos: 


U”! =(1+06;)(1+0ô)U”. 


Obtemos assim a equação (13.57) que aproxima a solução com erro de truncamento da 
O(k? + kh?). Para um problema de valor inicial com condições dadas sobre o plano t = 0, 
—oœ < xr < œ,—0%0 < y < œ, se usarmos o método LOD temos a mesma precisão e estabi- 
lidade mas mais economia de cálculos do que usando (13.57). Já o método de Crank-Nicolson para o par 
de equações (13.66) toma a forma: 


1/urtê-ur) o aurtis ur 
2 k/2 = 2h2 


1 [Ur+! — nt o Ea PG 
2 k/2 2h2 


que pode ser reescrito como: 


(1-562) Urt? = (1+2) u” 
(13.68) 


(1- Za) UH = (1+ 2a) Ur+ã 


Se os operadores d2 e ô comutam, e este é o caso quando o domínio é um retângulo de lados paralelos 
aos eixos x e y, então o método é equivalente ao método Peaceman e Rachford. O método LOD 
construído acima é de segunda ordem, é incondicionalmente estável e envolve apenas a solução de sistemas 
tridiagonais. 

Neste capítulo tentamos apresentar uma coleção representativa dos diferentes tipos de métodos e 
problemas em equações parabólicas. No entanto o leitor com aplicações mais específicas pode encontrar 
um grande número delas em Ames [?], Thomas [?] Lapidus & Pinder [?] e Sod [?]. 


13.6 Equações Elípticas 
Problemas de equilíbrio em duas ou três dimensões geralmente dão origem à equações elípticas. Exem- 


plos típicos dessa classe são problemas de difusão e de pressão, problemas em elasticidade, problemas de 
camada limite, problemas de vibração de membranas, etc. Mais simplificadamente, os problemas elípticos 
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caracterizam-se pela propagação de suas propriedades físicas em todas as direções coordenadas indistin- 
tamente, ao contrário das equações parabólicas e hiperbólicas onde essas propriedades propagam-se em 
direções preferenciais. Daí porque as condições de fronteira de um problema elíptico são normalmente 
especificadas ao longo de toda a fronteira. 

Seja R uma região limitada do plano com fronteira OR. A equação 


2 2 2 i 
ale) 5 + ey) +e(x, DE =d (a Y, u, as 5) (13.69) 
de acordo com a definição apresentada na seção 2.2 do capítulo 2 é elíptica em R se b? — ac < 0 para 
todo ponto (x,y) de R. Como já observado anteriormente uma equação diferencial como necessita 
de condições iniciais e/ou de fronteria para constituir-se num problema bem posto. Isto ocorre porque, 
suponha que w seja uma solução da equação com d = 0, então v = u + aw será uma solução de 
(13.69) para qualquer valor de a, onde u é uma solução particular de (13.69). Esta observação indica a 
possibilidade de que a equação sozinha tenha infinitas soluções e portanto precisamos de condições 
adicionais para assegurar unicidade. 

Imaginamos que não seja dificil para o leitor compreender a necessidade de um problema ter uma 
única solução para que seu tratamento numérico possa ser considerado. Não faria muito sentido tentar 
aproximar a solução de um problema para o qual não existe uma, ou que tenha uma infinidade delas, 
caso em que o método numérico ficaria totalmente indeciso sobre qual delas perseguir. De forma que 
parece claro que só tem sentido tentar resolver numéricamente um problema com solução única. Já a 
importância da continuidade em relação aos dados iniciais, para a solução numérica, pode não ser tão 
óbvia. Ocorre que quando resolvemos um problema numéricamente, estamos fazendo aproximações, e 
tudo se passa como se na verdade estivessemos resolvendo um outro problema cujos dados iniciais sofreram 
uma pequena perturbação. Se o problema não se comporta bem com relação à pequenas perturbações 
nesses dados, a solução numérica obtida será desastrosa. 

Vimos então a necessidade de que à equação seja adicionada condições de fronteira e que essas 
condições de fronteira devem ser escolhidas de maneira a resultar em um problema bem posto. Felizmente, 
a maioria dos problemas que reclamam um tratamento numérico provêm de aplicações práticas e essas 
mesmas aplicações determinam as condições de fronteira, formando problemas bem postos. 

Três tipos de problemas distintos envolvendo a equação podem ser destacados dependendo 
das condições de fronteira: 


e (i) o problema de Dirichlet, requer que a solução u de (13.69) seja conhecida sobre a fronteira OR, 
isto é, 
u(x, y) = f(x,y), (x,y) € OR. 


e (ii) quando gu é conhecida sobre ØR, ou seja, 


ðu 


3 = g(x,y), (x,y) € R, 
n 


onde n é a normal externa à fronteira OR, o problema de valor de fronteira é conhecido como 
problema de Neumann. 


e (iii) o problema de Robbins ou misto, surge quando conhecemos 


0 
alz yju+ pley) = y(x, y) sobre ØR, 


onde a(x, y) >0,9(x,y) >0, (x,y) € R. 
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Quando em (13.69) tomamos a = c = 1 e b = d = 0 obtemos o protótipo de equação elíptica mais 
conhecido que é a famosa equação de Laplace 


— (tuga + uyy) = 0. (13.70) 


Passamos à seguir a discutir métodos de aproximação para a classe de equações elípticas. 


13.7 Métodos de Diferenças Finitas 


Os métodos de diferenças finitas, a exemplo do que fizemos no capítulo 3 para as equações parabólicas, 
consistem em substituir as derivadas parciais presentes na equação diferencial por aproximações por 
diferenças finitas. Para isto é necessário que os pontos onde essas diferenças serão calculadas sejam pré 
estabelecidos, ou seja é necessário a definição de uma malha de pontos no domínio. Para ilustrar como 
esta discretização é realizada na prática consideremos a equação de Poisson: 


—Au = (Ugo + Uyy) = Í, (13.71) 
definida no retângulo R = {(x,y),0 <x <a,0 < y < b} com condição de Dirichlet: 


E T (13.72) 


sobre a fronteira, OR desse retângulo. 

Primeiramente, para que possamos aproximar Urr € Uyy por diferenças finitas cobrimos a região R com 
uma malha. Escolhemos a opção mais óbvia que consiste em traçar linhas paralelas aos eixos coordenados, 
conforme ilustrado na figura 4.1. Os pontos dessa malha serão denotados por (x;,y;), zi = ih, yj = jk,i 
0,1,---M,j = 0,1,--- N, onde h representa o espaçamento na direção x e k na direção y. Denotamos 
por Rs os pontos da malha interiores a R, isto é, 


Ro=(z,y;)),0<i<M,0<j< NH 
e por OR, os pontos da malha que estão sobre a fronteira ou seja, 


Figura 4.1: Malha de discretização 


Podemos agora aproximar as derivadas da equação (13.71) da seguinte forma: A equação (13.71) é 
válida para todos os pontos de R então em particular para um ponto genérico de Rs podemos escrever, 


—(uze(£i, Yj) + Uyy(mi, Yj)) = f (£i, y5). (13.73) 
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Assim, as derivadas podem ser aproximadas por: 


u(xi + A, yj) — 2u(2:,9;) + ulzi — h, yj) 
h2 


Usa (Di, Yi) = 


ulzi yj + k) — 2u(xi, yj) + ulzi yj — k) 
Uyy(ti y) = 7 T2 1 J . 


Substituindo essas aproximações em (13.73) obtemos: 


(= +h, yj) — 2u(zi, yj) + ulzi — h, yj) 4 u(xi, yj + k) — 2u(x;, yj) + ulti, yj — 2) 
h2 k2 


Note que a expressão não representa uma equação porque o segundo membro é somente uma 
aproximação para o primeiro e portanto não temos uma igualdade. Isto decorreu de termos substituído 
Uza(Zi,Yj) € UyylXi, Yj) por suas respectivas aproximações. Podemos transformar numa equação, 
simplesmente trocando o sinal ~ pelo de igualdade. Se assim procedermos, no entanto, não poderemos 
mais garantir que os valores numéricos presentes no lado esquerdo de coincidam com os valores 
da solução de nos mesmos pontos. 

Seguindo a notação utilizada na literatura denotaremos por u; j O valor da solução no ponto (xi, yj) 
e por U; j a solução da equação de diferenças: 


h2 k? 


A equação (13.75) deverá ser aplicada para todos os pontos em Rs. Para os pontos em Rs calculamos 
Ui j da condição de fronteira de Dirichlet 


Ui j = g(£i, Yj). (13.76) 


Nossa esperança quando escrevemos a equação é que U; j seja uma aproximação para u(x;,yj;), 
isto é, U; j = u(x;,y;). Demonstraremos mais adiante que, de fato, isto é verdadeiro. Provaremos mais 
ainda que U; ; “converge” para u(x;,y;) quando a malha é refinada. Para simplificar a notação para a 
equação de diferenças definimos o operador: 


NE = Ui, — 2U;; + Uit Uig — 2U;; + Uij 
Mij = h2 i k2 i 
Com essa notação as equações discretas (13.75)-(13.76) podem ser reescritas na forma: 
Ui j = g(£i, Yj), (£i, yj) E ORs. (13.78) 


Substituindo na equação cada um dos (N —1)x(M-—1) pontos interiores da malha em Rs veremos 
que a função discreta U satisfaz um sistema de equações lineares com (N — 1) x (M — 1) equações no mesmo 
número de incógnitas, incógnitas essas que são as aproximações para a solução da equação diferencial nos 
pontos da malha. Em notação matricial, seguindo a convenção notacional adotada no caítulo 3, podemos 
escrever esse sistema como: 


AU = c 
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onde o vetor U a matriz A e o vetor c são dados respectivamente por: 


T 
U = (U11, U21500: , Un-1,1; U1,2;, U2,2;*° Una,» E Um, Uam-,': E ,Un-1,M-1) 


a b c 
b a b 0 
0 
c 
A= Rie Sia A (13.79) 
ë 
0 
0 b a b 
c b a 


_ I(2N,Y1) , J(EN-1, Y0) 


F(zn-1,y1) t h2 U k2 
Na matriz A os números a, b e c são os coeficientes da discretização de 5 pontos e são dados por: 
2 2 1 
a = R2 + p2’ c= TK 


Já o valor de b não é constante na matriz toda. Em algumas posições esse valor é nulo. Essas 
posições correspondem àqueles pontos situados sobre a fronteira que são dados pelas posições da matriz 
A(px(M-—1),px(M—1)+1)e(px(M-—1)+1,p*(M —1)) com p = 1,2,.... Nas demais posições o 
valor de b é b = -5 

Talvez essas idéias fiquem mais claras se considerarmos um exemplo. 


Exemplo 13.7.1 Consideremos a malha mostrada na figura abaixo para o domínio 
O<r<le0O<y<l. 
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Figura 4.2: Malha de discretização com h = k = 3 


Existem 4 pontos internos: Pi 1, Pi 2, P21, P2,2, (Pi; = (2;,y;)). Nesse caso N = M = 3. As condições 
de fronteira para o problema de Dirichlet são dadas como: 


u(0,y) = 0, u(l,y)=1, u(z,0) = 0, u(z,1)=0 
Observe que estamos utilizando h = k e portanto a equação (13.75) pode ser reescrita como: 
4U; j Uia, U;a, Ui j+1 Urj=i + h? fij. (13.80) 


Variando os índices i e j obtemos: 


1 
4U1 1 — U21 — Uo,1 — U12 — U10 = = fi 


9 
1 
4U1,2 — U2,2 — Uo,2 — U1,3 Uia = gfi (13.81) 
1 
4U2,1 — Usa — Uia — U2,2 Uzo = g f2 
1 


405,2 — Uso — U1,2 — U2,3 U21 = g f22 


Todos os valores de U; į para i = 0 ou i = 3 e qualquer j e j = 0 ou j = 3 e qualquer i são conhecidos. 
Substituindo esses valores nas equações (13.81) acima podemos reescrevê-las na forma matricial como: 


deseo -1 0 Ui fıi1/9 
-1 4 0 -1 U | fi2/9 
-1 0 | Uz1 | | 1+4 f21/9 
0 -1 -1 4 U22 1+ f22/9 


13.8 Erro de Truncamento Local 


Comentamos na seção anterior que a aproximação gerada pela discretização por diferenças finitas 


“converge” para a solução do problema (13.71]13.72). Nesta seção vamos demonstrar esse fato para o 
caso de um domínio retangular. Para esse fim precisamos introduzir alguns conceitos e resultados. 


Note que a expressão (13.74) não é uma igualdade, de forma que podemos definir a quantidade: 
Tij = — Au; — f(x, y;). (13.82) 
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Lema 13.1 Se a solução u(x,y) é diferenciável até ordem 4 com derivada limitada, então o erro de 


truncamento local definido por (13.82) satisfaz: 
[Til < cih? + cak? 


onde cy e c2 são constantes independentes de h e k. 


Prova: Da definição do operador As temos o seguinte: 


u(t yj +k) — 2u(x;,y;) + ulzi yj — k) 


h2 


(e +h, yj) — 2u(x;,y;) + ulzi — h, yz) 


k2 


(13.83) 


) Feny). 


Expandindo os termos u(x; + h, yj), u(xi — h, yj), ulzi, Yj +k) e u(zi, yj — k) em série de Taylor em torno 
do ponto (xi, yj) obtemos: 


u(x; + h, yj) 
u(x; — h, yj) 
u(zi, yj + k) 
ulzi, yj — k) 


onde 


E1, 2,1 


E2 € (£i — h, xi), M1 


h2 h3 ht 
ulti, Yj) T huz(£i, Yj) Es gj Yre (Zi, yj) ir ap Yereli, Yj) T AGE Yj) 
h? n3 há 
u(L;, yj) = hus(zi, y5) T gj Una (Zi, Ya) E ap teze(Zi yj) + qr verel Yj) 
k? k3 ki 
ulzi, yj) + kuy(zi, yj) + gj vyti Yj) + 31 “vvu (ti Yi) T grusom) 
k2 k3 k4 
u(xi, yj) — kuy(xi, Yj) + ap toytoy) = 31 “vvu (ti Yi) T qr rrn m) 
no são pontos arbitrários nos intervalos & E (xx; + h), 
(yj yj + k) n2 E (yz — k, y5). 


Substituindo essas expansões em (13.83) e simplificando os termos semelhantes obtemos: 


Tiz 


Da hipótese que as derivadas uzr rx € Uyyyy existem e são limitadas segue que os números P = mazļ|uzrrzs (£, y)| 


h2 


k2 


+Uyy(£i, Yj) + qr vvvvu(ti m) + qi uvv (ti no) — f (£i, yz) 


lesse (Eis yj) + 


2 


gr teses (é , yj) 


k2 


(13.84) 


e Q = maz|uyyyy(%,Y)| estão bem definidos. Assim tomando módulo em seguida o máximo da expressão 
(13.84) e considerando que Uzr + Uyy = f obtemos: 


P 
T; ;| < =R? 
| TEST F 


Q 


tea 
198 


(13.85) 


Observe que nesse caso o erro de truncamento local decresce ao refinarmos a malha, isto é, ao fazermos 
h e k menores. Na verdade o lema [13.1] nos diz mais do que simplesmente que o erro diminui, ele nos 
dá a velocidade de convergência desse erro, que nesse caso é quadrática. No entanto, isto não implica 
necessáriamente que o erro global definido por; 


também está decrescendo. 


eij = tij — Ui 


Ev) 


resultados preliminares que passamos a apresentar e demonstrar. 


(13.86) 


Provaremos esse fato à seguir; mas para esse fim necessitamos de alguns 
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Teorema 13.5 (a) Se V(x,y) é uma função discreta (de malha) definida sobre R5lJOR, e satisfaz 
AsV (x,y) >0, V(x,y) € Ro, 


então, 


max V(x, o max V(x,y). 
(x,y)ERs (a, 3) (x,y)EORs (a, 4) 


(b) Alternativamente, se V(x,y) satisfaz 
AsV(x,y) < 0, V(x, y) € Rs, 
então, 
min V(z,y) > min V(z,y). 


(£,y)ERs (z,y)EðRs 


Prova: Provaremos a parte (a) por contradição. Suponhamos que em algum ponto P) = (£r, Ys) de Rs 
temos V(Po) = Mo onde Mg > V(P),vP € Rs e Mo > V(P),vP € Rs. 


Sejam 
Pi = (£r +h, ys), 
P» = (Dr — h, Ys), 
P, = (dris g k) e 
P, = (Lp, Ys a k). 


Então, usando (13.75) podemos escrever 


AsV(P)) = d uad | Pty) + rt) (h | =) vim. 


Mas, por hipótese, temos AsV (Po) > 0, de modo que 


Mo = V(P») 1 ( 1 V(Pi) +V(Po) i 1 ABE), 


< 

S IJR F 1/82 (M 2 k? 2 
Como Mo > V(Q), YQ € R$5UôÔRs, implica que V(P,) = Mo para v = 1,2,3,4, pois se V(P,) < Mo 

para algum v = 1,2,3,4 então (13.87) implica o seguinte: 


(13.87) 


Mo = V(Po) < 


1 (p r) 
| = Mo 


1/h2+1/k2 \h2 2 k 2 


o que leva a uma contradição pois My não pode ser estritamente menor do que ele mesmo. Lembre-se 
que estamos supondo que Mo é o máximo de V em todo o domínio e portanto V(Q) < Mo VQ. 

Agora, repetimos esse argumento para cada um dos pontos interiores P, no lugar de P). Por re- 
petição, cada ponto de Rs e Rs aparece como um dos pontos P, para algum correspondente Po. Assim, 
concluímos que 


V(P) = Mo para todo P € Rs U ôR5, 


o que contradiz a hipótese que V < Mo em Rs. Daí, a parte (a) do teorema segue] 
Para provar a parte (b), podemos repetir o argumento acima. Entretanto, é mais simples recordar 
que 


lNa verdade provamos mais que isso. Provamos que se o máximo, no caso (a) ou o mínimo, no caso (b), de V(x,y) 
ocorre em Rs, então V(x,y) é constante em Rg e Rs. 
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max|—-V (x, y)] = — min V (x,y), 
As(—V) = —As(V). 


Portanto, se V satisfaz a hipótese da parte (b), então —V satisfaz a hipótese da parte (a). Mas a 
conclusão da parte (a) para —V é a mesma da parte (b) para V. 

Aplicando adequadamente o princípio do máximo podemos obter um limitante para a solução da 
equação de diferenças (13.75). O resultado, chamado estimativa a priori, pode ser dado por: 


Teorema 13.6 Seja V(x,y) qualquer função discreta definida sobre os conjuntos Rs e ORs. Então, 
2 
a 
max |V(x,y)|< max |V(z,y)l+— max |AsV(a, 13.88 
me Vels mas, Vev) max, AVe) (13.88) 


Prova: Vamos introduzir a função 


e observemos que para todo (x,y) E€ Rs U Rs, 


N 


a 


0< ġlz y) <y e Asólz,y)=1. 


Agora, sejam Vi (x,y) e V(x, y) dadas por 


Va (x,y) = +V(z, y) mr Nog(x, y), 


onde 


No= max |AsV(x,y)|. 
(x,y) Rs 


Para todo (x,y) E€ Rs é fácil mostrar que (ver exercício[13.36) 


AsVe(x,y) = EAsV(x,y) + No > 0. 


Assim, podemos aplicar o princípio do máximo, parte (a) do Teorema a cada Vi(x,y) e obtemos, 
para todo (x,y) € Rs, 


Velr,y) < max Vi(x,y) = 
NE a a) 


a 
max [+EV(x,y) + No9) < max [EV(z,y)|+ No—. 
a i a! (x,y) 06] M A. (z,y)] 03 


Mas, da definição de V+ e do fato que & > 0, obtemos: 


+V(a, y) < Ve (z; y). 


Portanto, 


2 


a 
+V(x,y) < max [+V(x,y))+ No < max 
(210) S masa ev] A No S maia, 


2 
aQ 
|V (x, y)| + z No- 


Como o lado direito da desigualdade acima é independente de (x,y) E Rs o teorema segue. 
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Observação 13.8.1 Note que podemos substituir a em (13.88) por E desde que usemos (x,y) = %5 
no lugar de (x,y) na prova do teorema. 


Para encontrar uma estimativa para o erro global, tomaremos no teorema 
V(x,y) = e(x,y) então segue que: 

a? 
Eei j < mazar,|ei,;| + a No. 


Mas como U; j = uij = gij na fronteira OR5 temos que e; ; = 0 em R5. Assim, 


ou seja, 


Agora, 
Asei j = Aslulxi, yj) — Ui) = Asulzi yj) — AsUi j Aguia — fij = Tij, 


usando (13.82). Assim, 
a? a? 3 2 
lei! < marr Tijl < zg Ph + QK). 
Portanto o método numérico definido em (13.75) produz uma solução U; ; que converge pontualmente 
para a solução u(x;,y;) quando h > 0 e k > 0 com x; = ih, yj = jk valores fixos. 


Corolário 13.1 Uma conseguência do teoremal[13.6|é que o sistema de equações lineares AU = c definido 
pela matriz (13.79) tem uma única solução. 


Prova: Provaremos que o sistema homogêneo correspondente a (13.75) tem somente a solução trivial. 
Para isso consideremos o problema homogêneo: 


—(uza + Uyy) = 0 em R 


com condição de fronteria homogênea u = 0 sobre a fronteira OR, cuja única solução é óbviamente a 
solução u = 0. Discretizando esse problema como fizemos para obter (13.75) obtemos um sistema linear 


homogêneo para as incógnitas U; j. Utilizando agora o teorema com V(x,y) = u(x,y), teremos: 
MATR; Ui j < MALƏR; Ui, j =0. 


Por outro lado como A5U; į; = O pois estamos assumindo que U; ; é solução da equação de diferenças, 
temos também , usando a parte (b) do teorema 


MiNR; Ui j > MinaRr, Ui, = 0. 


Assim, U;,; = 0 é a unica solução do sistema em questão. 


13.9 Condições de Fronteira em Domínios Gerais 


Na prática raramente os problemas apresentam-se em domínios retangulares, de forma que os métodos 
apresentados na seção anterior teriam pouco valor na solução de problemas reais não fossem eles es- 
tendíveis para domínios mais gerais. Nesta seção apresentaremos duas técnicas para aproximação numérica 
da equação de Poisson com condição de fronteira de Dirichlet em domínios gerais. O caso da condição 
de Neumann é bem mais complexo e será tratado em outra seção. Consideremos então o problema de 
Dirichlet num domínio R como o da figura 4.3 abaixo. 
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Figura 4.3: Domínio Geral - Aproximação por lados da malha 


Observação 13.9.1 Na figura 4.3 e seguintes estaremos utilizando a localização geográfica para rotular 
os pontos da discretização de 5 pontos, isto é, o ponto central da discretização chamaremos de C, N para 
o ponto acima (Norte), S para o ponto abaixo (Sul), L para o ponto à direita (Leste) e O para o ponto à 
esquerda (Oeste). 


Notemos que ao contrário do caso de domínio retangular, neste caso os pontos onde a condição de fronteira 
é conhecida não fazem parte da malha e portanto não podemos utilizar a condição de fronteira para 
eliminá-los da equação (13.75). A primeira técnica que apresentamos consiste em aproximar a fronteira do 
domínio por segmentos da malha como ilustrado na figura 4.3 acima pela linha mais grossa. Completada 
essa aproximação passamos a resolver o problema no novo domínio supondo que a condição de fronteira 
u(x, y) = g(x,y) aplica-se agora sobre a nova fronteira. Como pode ser facilmente e diretamente observado 
da figura 4.3, ao refinarmos a malha melhores aproximações da fronteira são obtidas. Entretanto, esse não 
é o método mais preciso que podemos deduzir. Sua grande vantagem está na simplicidade e facilidade de 
aplicação. Na prática, quando aproximamos o domínio pelos lados das células e transportamos a condição 
de fronteira para essa nova curva, (observe o ponto P na figura 4.3), estamos aproximando o valor de 
Uo por aquele de Up, ou seja, estamos interpolando u na célula por um polinômio constante de grau 
zero. Como é sabido da teoria da aproximação [?], o erro em tal aproximação é de ordem h. Já o erro de 
aproximação da equação diferencial por diferenças finitas, como foi mostrado em (13.85), é de ordem h2. 
Por essa razão foi comentado acima ser esse um método que não goza de boa precisão. 

O sistema linear resultante da aplicação dessa técnica é similar àquele obtido para o caso de um 
domínio retangular tendo a forma AU = c onde U representa o vetor das incógnitas, a matriz A tem as 
mesmas características daquela em a menos do fato de que a subdiagonal onde aparece a constante 
c deixa de ser uma diagonal e os valores aparecem em zig-zag. 


Exemplo 13.9.1 Considere como um exemplo, a eguação de Poisson com condição de fronteira de 
Dirichlet para o domínio da figura 4.4. 
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Figura 4.4:Exemplo de discretização com 24 pontos internos. 


A discretização dessa equação por diferenças finitas de cinco pontos tomando como aproximação da 
fronteira irregular os lados da malha, conforme ilustrado pela linha cheia na figura 4.4, obtemos um 
sistema linear 24 x 24 AU = c onde: 


U = (U1, U2,- . . , Us)” 


com U; denotando uma aproximação para u(x, y) no ponto da figura marcado com i. 


a c 
a b c 
b a C 
c b b c 
b a c 
a b c 
c b a b c 
c b a b c 
c b a c 
c b c 
a b 
c b a c 
A= c b b c 
c b ab c 
c b a b c 
c b a c 
c a b c 
c b a c 
c b a b c 
c b a b 
c b 
c a b 
c b a b 
c b a 
onde 
PA? 1 1 
a= — + b=-5 e c= 


h2 kZ h2 K 
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O vetor c contém o valor da função f(x,y) avaliada nos pontos correspondentes à enumeração da figura 
4.4 e também os valores da fronteira, por exemplo a primeira coordenada de c é: 


g(£4, Y1) + g(z6, y1) 4 g(£5, Yo) 
h? k? 
que corresponde ao valor de f no ponto 1 adicionado aos valores da fronteira correspondentes aos pontos 
à esquerda e à direita de 1 e tamém do ponto abaixo. 
As demais coordenadas de c são calculadas de maneira similar e deixamos como exercício. Ver 


Exercício (13.97). ) 


A outra técnica consiste na utilização de um polinômio de primeiro grau na interpolação. No caso 
da figura 4.3 utilizamos os pontos P e C para interpolação e avaliamos esse polinômio no ponto O, na 
verdade uma extrapolação! Assim o valor de Uo será expresso como função dos valores de Up que é 
conhecido e de Uc que não o é. Isto produz uma equação que permite a eliminação de Uo da equação 
de diferenças para Uc. 

Deduzimos à seguir as fórmulas para o caso especial do ponto C da figura 4.3. Na notação da figura 
4.3 temos 


Cj = f(z5,y1) F 


Uo — 2Uc +U Un — 2Uc + Us 
h2 ! Te = fo. (13.89) 


A grande dificuldade de (13.89) comparado com (13.75) é que em (13.89) o valor de Uo é desconhecido 


pois este não está sobre a fronteria como seria o caso quando o domínio é retangular. Observe na figura 
4.4 a ampliação de uma parte da figura 4.3 onde mostramos uma célula onde a fronteira do domínio corta 
seus lados. 


Figura 4.4: Interpolação Linear 
O polinômio linear que interpola Up e Uc é 
1 
(x m zo)Up = (a e zp)Uc] y 
TtTP— TC 


A aproximação para Uo pode então ser facilmente deduzida substituindo x por xo na expressão acima 
para obter: 


Uo = (xo — xo)Up — (xo — zp)Uc] aa = [ AU p 4 (1 01)hUc] TA 


II 

| 
T 
| 
T 
| 
ss 
E 
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Da mesma forma 


Substituindo essas aproximações em (13.89) obtemos: 


Uq-—(1-0)Up 
b2 


i K 2Ug + Urg| = fB. 


2Up + | 
h? A Pa Uc! | 


k2 
Eliminando agora os termos semelhantes e passando para o segundo membro os termos conhecidos obte- 
mos a equação final: 


= [v Cttee] 1 


72 A "e [Ux 


= E Up Ug di 


h20, k20 


Uma variação da técnica de interpolação acima descrita e que é muitas vezes preferida na prática por 
tratar-se de interpolação propriamente dita e não extrapolação é a seguinte: 

Aplica-se a equação de diferenças de 5 pontos somente para aqueles pontos da malha interiores ao 
domínio e para os quais todos os 4 vizinhos estão no domínio. Para pontos interiores ao domínio com 
algum vizinho fora dele, calculamos uma aproximação por interpolação. Assim, para o ponto C da figura 
4.3 calculamos uma primeira aproximação para Uc interpolando na direção x os pontos Up e Ur em 
seguida calculamos uma segunda aproximação para Uc interpolando na direção y os pontos UQ e Uyn e 
finalmente adotamos como aproximação definitiva para Uç a média ponderada pelas distâncias dos dois 
valores obtidos, formalmente: 

Calculamos o polinômio que interpola Up e Uz dado por: 


1 

xz — ztp)Ur — (z — tL)Up| ——. 
Ks- sp)Ur - (2 — s1)UP] mp 

Avaliamos esse polinômio no ponto xc para obter a primeira aproximação U4 de Uc. 


y, — Ur +hUp _ 0Ur + Up 
C end, — 1+% 


Da mesma forma calculamos uma segunda aproximação U de Uc interpolando na outra direção e 


obtemos: 
hO,Un + hUq = 05Un + Uq 


h + hds» 1+0> 


Finalmente uma aproximação para Uc pode então ser derivada tomando a média ponderada: 


Er 


haUg+hooUZ US +602U2 
Uc = Č Œ Č C 
hı + hba b+ ` 


Maiores detalhes sobre as técnicas aqui descritas podem ser encontrados em [?] e [?]. 


13.10 Condição de Fronteria de Neumann 


Consideramos nesta seção o problema de Poisson com condição de fronteira com derivadas, ou seja, 
condições de fronteira de Neumann. No caso de domínio retangular o problema é: 
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Figura 4.5: Problema de Neumann no retângulo 


Diferentemente do caso da condição de Dirichlet onde o valor de u é conhecido na fronteira, no presente 
caso devemos determinar u tambem nos pontos da fronteira. De forma que precisamos considerar a 
equação de diferenças finitas para pontos como o ponto C da figura 4.5. Como a equação de diferenças 
utiliza pontos para traz e para frente (também para cima e para baixo) teremos que introduzir pontos 
fantasmas que estão fora do domínio de cálculo, como aqueles formados pelas linhas tracejadas da figura 
4.5. Utilizamos então as condições de fronteira para eliminá-los. Assim, a equação de Poisson discretizada 
no ponto C fica: 


Uo — 2Uc+ Us, Un — 2Uc +Us _ 
h2 + k2 a 
O ponto O é fantasma e deve ser eliminado. Descrevemos à seguir como eliminar esse ponto. Procede- 
se de maneira similar na eliminação de pontos sobre as outras linhas tracejadas. 


fo. (13.91) 


Com esse objetivo aproximamos a condição de fronteira duo) = fa(y) por diferenças centrais no 
ponto C para obter: 
Uz — Uo 
falyo) = ~op 
ou seja 
Vo = U; — 2h f4(yo). (13.92) 


Portanto (13.91) transforma-se em: 


Uz — 2hfa(yc) — 2Uc + UL , Un — 2Uc + Us 
h2 j k2 


= fo. 
Eliminado os termos comuns e passando aqueles conhecidos para o segundo membro obtemos: 


2U, -2WUc | Un — Uc -U 2 
E r (13.93) 


h? k? h2 


Observando as equações e concluimos que o efeito das condições de fronteira no primeiro 
caso e da irregularidade da fronteira no segundo, sobre as equações discretizadas é a modificação do termo 
independente no lado direito dessas equações e também a modificação de alguns elementos da matriz 
de coeficientes. As modificações na matriz são as mais relevantes pois apesar de somente uns poucos 
elementos sofrerem modificações, estas podem ser suficientes para destruir propriedades importantes da 
matriz tais como simetria e diagonal dominância. 
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O caso de domínios irregulares com condição de Neumann é muito mais complicado para o tratamento 
com diferenças finitas. A grande dificuldade reside no fato de conhecermos a derivada direcional u sobre 
a fronteira do domínio de forma que ao, por exemplo, aproximarmos o domínio pelos lados das células da 
discretização, como descrito para o caso da condição de Dirichlet, não podemos simplesmente transportar 
essas condições para os pontos da malha pois precisamos levar em consideração os cossenos diretores das 
derivadas direcionais. Isto torna esse expediente extremamente tedioso e complexo o que leva alguns 
autores [?] a sugerir que esses termos devam ser ignorados e devemos então considerar as condições de 
fronteira sobre a malha como se aí fosse realmente sua localização. Esse processo obviamente introduz 
erros que são de dificil análise. 


13.11 Diferenças Finitas em Coordenadas Polares 
A mudança de variáveis « = r cos(0),y = r sen (0) transforma a equação de Poisson em: 


Ou E 1 ðu rs 1 8 
ôr? rôr r? 002 


= h(r,0) (13.94) 
Essa transformação pode ser bastante simplificadora no tratamento da discretização do domínio no 


caso deste conter formas circulares, pois nesse caso as derivadas em (r, 0) são derivadas direcionais nas 
direções do raio e do ângulo, de forma que podemos utilizar uma malha como mostrado na figura 4.6. 


Figura 4.6: Discretização em coordenadas polares 


A equação aproximada no ponto (i, j) da malha toma então a forma: 


Uang- 2Uij+Ui-lj _ 1 [Umag -Ui-l j 
h? ih Zh 
1 [Uiz —2Uij+Uij-—1 = 
da = h(ih 
(ih)? ( 58 go) 


Notemos que a equação acima tem a mesma forma da equação a menos dos termos resultantes 
da discretização da derivada de primeira ordem. No entanto esse termo irá agrupar-se com aqueles 
provenientes das derivadas de segunda ordem e ao final teremos o mesmo tipo de molécula de cálculo de 5 
pontos tão bem conhecido. Os coeficientes da discretização serão porém distintos daqueles que aparecem 
na discretização da equação de Poisson em coordenadas cartesianas, como na equação (13.75). 
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13.12 Exercícios 


13.1 Mostre pelo método de separação de variáveis que a solução do problema é dada pela 


fórmula (13.19). 


13.2 Seja a equação 
Ut = Uzr O<r<l 


com condições de fronteira u(0,t) = u(1,t) = 0, para t > 0 e com a condição inicial: 


_ J] 2; para 0< zx 
we) = | 2— 2x, para $ <x 


cuja solução exata é: 
u(x,t) = 2 S s wa sen (nrx))exp(—n?r’t) 
l mê n=1 2 


Faça um programa de computador para resolver esse problema usando o método explícito com h = 0.05 


Faça um gráfico da solução numérica e da solução exata para cada um dos casos acima, plotando U 
eu contra x para vários valores de t, por exemplo, t = 0.05,0.1,0.15,...,0.5. Observe atentamente os 
gráficos dos dois casos. Note que a solução inicial tem uma descontinuidade na primeira derivada no 
ponto x = 1/2, e esta descontinuidade é suavizada imediatamente quando entramos no domínio. Esta é 
uma propriedade geral das equações parabólicas e elípticas. Obtenha pelo método de separação de variáveis 
a solução exata desse problema. 


13.3 Mostre que a equação de diferenças 
Uis,j41 = Ui, + o(U;-1, — 2U ij + Ui+1,) 


admite uma solução separável U;; = X;T;. Determine as equações para X; e Tj. Obtenha soluções para 
essas equações substituindo X; = exp(iA) e determinando dois valores para À, que chamaremos Ay e Às 
e a solução X; pode ser então determinada por superposição como: 


X; = Ci exp(ih1) + Co exp(iÃo) 
com Cı e Ca constantes arbitrárias. 


13.4 Mostre que escolhendo o = E em (13.17 e levando em consideração a expressão (13.21) obtemos 


um método que é condicionalmente consistente de ordem 2 com a equação do calor ut = Urg. 
13.5 Mostre que o método explícito 


20 40 
Uij+i = Uii + (l 20)Uij + -Uia 


não é consistente com a equação Ut = QUya. Encontre a equação para a qual esse método é consistente. 
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13.6 Mostre que a matriz (A)py = exp(Iagph), p = 0,1,...N, q = 0,1,...N, onde ag = F, é não 
singular. 

Sugestão: Observe que A é uma matriz de Vandermond. 
13.7 Considere a equação diferencial 


Ut = Uzr + bu, t>0, LER 


com b > 0. Analise a convergência do método de diferenças finitas: 


Us,j41 = CU ;-1,j + (1 — 20 + bk)U; j + CU) = 0,41: 


13.8 Considere a equação diferencial 


Ut = Urz +buzr, a>0, OSIL, O<t<T 
u(x,0) = ylz), O<r<L 
u(0,t) = ft), O<t<T 
u(L,t) g(t), O<t<T. 


Discretizando essa equação pelo método explícito e diferenças centrais para aproximar uy obtém-se: 


bk 


bk 
Ui j+1 = (o + zp UHL + (1 — 20)U;, j + (0 


Utilizando o critério de von Neumann estude a estabilidade desse método. Compare com a estabilidade 
do método resultante do seguinte critério para aproximar o termo ug: (chamado método “up-wind”) 
Aproximamos uy por diferenças progressivas se b > 0 e por diferenças regressivas caso contrário. 


13.9 Considere o seguinte problema de valor de fronteira de Neumann 


Ut = Urz, 4>0, 0O<ar<L, O<t<T 
u(x,0) = (x), O<u<L 
ðu(0,t 
= = olu- u), O<t<T 
L 
A = —@lu— uz), O<t<T 
dx 


onde 01,09 constantes positivas. 


1. Obtenha o método resultante da aproximação das condições de fronteira por diferenças centrais e 
da equação pelo método explícito. 


2. Obtenha o método resultante da aproximação da fronteira esquerda por diferenças progressivas da 
fronteira direita por diferenças regressivas e da equação pelo método explícito. 


3. Repetir os items acima considerando o método implícito para aproximar a equação. 


Escreva esses métodos em notação matricial. Qual o efeito das condições de fronteira na matriz dos 
coeficientes? Usando o segundo teorema de Gershgorin estude a estabilidade do método resultante do 
primeiro item, mostrando que a restrição de estabilidade é dada por: 

1 
2 + aih’ 2 + ash 


E 


o < min{ 
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13.10 Mostre que se para a equação de diferenças U;,1 = AU; +c; os autovetores de A são linearmente 
independentes e se seus autovalores A; satisfazem |A;| < 1+ O(k), Vi, então essa equação será estável. 


13.11 Seja A a matriz tridiagonal de ordem N 


a b 
cab 
cab 
A = 
c b 
a 
Mostre que os autovalores e autovetores dessa matriz são: (i = 1,2,..., N) 


a! A 
Ài =a + 2b (5) ? cos(a); 


ca iT C2 2im Cs Bir CN Nim 
E — 2 — = fa = f2 =F 
vi = (O! sen (a GË sen (GË sen De DF sele) 
Sugestão: Ver [?] páginas 113-115. 
13.12 Mostre que os autovalores e autovetores da matriz (13.30) são dados por: 
j j 2i N- 1)in \ 7 
ài = 1 — 40 sen? (5a) vi = (seni) sen (nr): es sen) f 


13.13 Mostre que os autovalores da matriz do método implícito são: 


iT 
A=1+4 Si 
+40 sen (57) 


e portanto os autovalores de A”! são + que são menores que 1 para todo valor de o implicando que esse 
i 
método é incondicionalmente estável, como já haviamos concluído. 


13.14 Prove a igualdade: 


Ou 1fa la, le, 
I2 M (5: 19% + gge + u. 


Utilize-a para obter a seguinte discretização da equação do calor: 


Uij+1—Uij _ 1 (5) di (5%) 
k 2 Ox? LiAl Oy? ij 


1 1 1 
= JR (z T T 500 a] (Ui j+1 + Uiz) (13.95) 


Aplicando o operador (1 + 02) a ambos os membros de (13.95) obtemos um método numérico de quarta 
ordem no espaço: 


(1 — 60)U;-1,;41 + (10+120)U; j+1 + (1-— 60o)Ui+i j+ = 
= (1+60)U,-1,; + (10 — 120)U; j + (1+ 60)Uip1,j 


Escreva o método acima na forma matricial e utilize o critério da matriz para estudar sua estabilidade. 
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13.15 Sejam pi(x) = ami” + amasol +--+ az + ao e po(x) = bix! + brazil +--+ bir + bo 
dois polinômios de graus m el e A uma matriz N x N. Se À é um autovalor de A com autovetor v e se 


pı(A) for uma matriz inversível então aia é autovalor de (pi(A))!pa(A) com autovetor v. Utilize esse 


resultado para mostrar que os autovalores da matriz de amplificação do método de Crank-Nicolson são: 


1 — 20 sen? (45) 
1 +20 sen?(45) 


(= 


13.16 Considere a seguinte aproximação para a equação do calor no intervalo [0,1]: 


3 1 
3 Ui, =} Tê DOU, + 


Utilizando o critério da matriz analise a estabilidade desse método. 


VU; j = 


13.17 Considere a equação parabólica não linear 
U = Ur m inteiro >2 


que pode ser aproximada pelo método implícito, 


aa Clan” FO” 


k h2 
Expansão em série de Taylor de (u(x;,t;,1))”, em torno do ponto (x;,t;) produz: 
(usa) = (ug) + + 
Oui 
= T mik is m—1 KZN] 
(uij) m(ui,j) De 


Dessa forma a menos de termos de ordem maior que O(k), temos a seguinte aproximação: 
(Vij+)” = (Uig)™ + m(Ui "(Uia — Ui) 


que se substituída na equação do método o torna linear. Escrevendo wi = U;,1,j— Ui,; deduza um sistema 
linear em termos dessa nova variável. 


13.18 Considere a equação parabólica não linear: 


ut = ġ(lx,t, U, Uz, Urs) O<au<l, O<t<T, 
u(z,0) = (a), 
u(0,t) = f(t), 
u(l,t) = g(t). (13.96) 


Esse problema constitue um problema bem posto se a condição n > a > 0 estiver Ea. no domínio. 
Expandindo u(x;,t;+1) em série de Taylor no ponto (xi, tj), e utilizando a equação para substituir 
u: deduza um método explícito para resolvê-la. 

Uma outra classe importante de equações parabólicas não lineares é: 


Uso = Qlx,t,u, uz, u), O<ar<l, O<t<T, 
u(z,0) = (x), 
u(0,t) = f(t), 
u(l,t) = g(t). (13.97) 
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Esse problema constitue um problema bem posto se a condição — > a > 0 estiver satisfeita no domínio. 


Discretizando as derivadas espaciais por diferenças centrais e a derivada temporal por diferença regressiva, 
no ponto (£i, t;+1), obtenha um método impícito para resolver (13.97). Qual a ordem desse método? 
Considere a equação parabólica quase-linear com 


dz, t, Ux; ut) E a(x, t, UU T b(x, t, ujur + e(x, t, u). 


baseando-se no exercício anterior obtenha um método implícito para resolver esse problema que seja linear, 
isto é cuja solução requeira a solução de um sistema linear apenas. Derive o método de Crank-Nicolson 


para a equação (13.97. 
v 


13.19 Seja Y a solução da equação do calor pi = Yra. Mostre que se Y = exp(—3) e u = vz, então u é 
solução da equação não linear: 
Ut = Ugy — UU. 


Utilizando a transformação acima encontre a solução exata do problema: 


Ut = Uau, O<xr<1, t>0 
u(x,0) = senta 
u(O,t) = u(L,t)=0 


Resolva esse problema numericamente utilizando um dos métodos discutidos acima e compare seus resul- 
tados com a solução exata. 


13.20 Determinar o erro de truncamento local e a estabilidade do método de Hopscotch. 
13.21 Mostre que cada uma das fórmulas de Saul'yev (2?-2?) é incondicionalmente estável. 


13.22 Utilizando o método da matriz mostre a que condição de estabilidade da equação de diferenças: 


Ui j+ = Ui j +o(U;-1, — 2U; + Uma), 1=0,1,...N-—1 
U 1; = U,+20h06,; 
Un; = 0 
éo < ITI Por outro lado usando o critério de von Neumann obtemos a condição o < 5. Conclua 


então que o critério de von Neumann é uma condição necessária mas não suficiente para estabilidade da 
equação de diferenças. 


13.23 Mostre que a complexidade algorítmica (número de operações aritméticas) do método explícito 
para resolver a equação do calor em 2D é: 4 adições + 3 multiplicações por ponto da malha. Mostre 
também que no caso de um método ADI esse número é: 10 adições + 8 multiplicações + 6 divisões. 


13.24 Considere o método obtido pela média ponderada dos métodos implícito e explícito: 


k 


Us,j41 = Ui, — 0 (062Ui,j+1 + (1 = 0)62U:,5) , o = A?" 


0<0<1. 


Observe que para 8 = O obtemos o método explícito, para O = 1 obtemos o método implícito e para 
0 = 1/2 obtemos o método de Crank-Nicolson. Deduzir a expressão do erro de truncamento local e 
usando a técnica de von Neumann mostre que para O < 0 < 1/2 o método é estável se o < 30-20) e 
incondicionalmente estável para 1/2 < 0 < 1. 


13.25 Mostre que os métodos implícito e ADI em 2D são incondicionalmente estáveis. 
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13.26 Mostre que os operadores 02 e 8? comutam quando o domínio onde eles se aplicam é um retângulo. Dê 
um contra-exemplo para ilustrar o caso em que o domínio não é um retângulo. 


13.27 Mostre que o método de Crank-Nicolson em duas dimensões com espaçamento k na direção t, hy 
e hy nas direções v e y, pode ser escrito como: 
Ox 


(1 = = E Zza?) Urt = (1 +58 + Zza) U” (13.98) 


k k 
hz € Ty = W 


Mostre que o termo: 


onde Oy = 


OzOy 


zô, (UT — U”) 


4 
é de ordem O(k?). 
Mostre que adicionando o termo 
Oxy 2 s27;n+1 
4 0704 
no lado esquerdo de (13.98) e o termo 
Izy 5262r 
4 Fy 


no lado direito, obtemos um método com a mesma ordem do método de Crank-Nicolson que pode ser 
fatorado na forma: 


D; o o fo) 
1 232) (1 162) urt — (1 | 232) (1 | 162) U” 
( De 2 4 po 2% 
13.28 Mostre que o método de Peaceman-Rachford para solução da eguação do calor não homogênea, 
Ut = Ugg + Uyy + F(x,y,t) 


toma a forma: 


o, 1 o. k 
1- Z É) n+ (1 Ea Zua?) n En 
( > d UT z 0v U” + > 
o T. 1 k 
1 so O i) n+1 = (1 42 2) n+5 “prá 
( z’) U z s) U is 


13.29 Escreva um programa MATLAB para resolver o problema: 


Pu Pu 9 

dr? Oy 
definido no quadrado [—-1,1] x [-1,1] com condição de Dirichlet nula na fronteira. Utilize h = 0.2. 
Compare seu resultado com a solução exata: 


u(z,y)=1—y? E » ani sech (==) cosh (=) cos (=) i 


13.30 Escreva um programa MATLAB para resolver o problema: 


definido no quadrado |—1,1] x [-1,1] com condições de fronteira dadas por: 
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1.u=0Oparay=1le-l<g<l; 
2. u=lparay=-le-l<gr<l; 


3. 2e = —0.5u para z =1 e —1 <y < l; 


4. 2u = 0.5u para x = —1 e—-l<y<l. 
Utilize uma malha uniforme com h = 0.1. 


13.31 Considere o problema 
Uxa + Uyy = O 
definido no domínio: 
R=((2,y), “+r+y<i, 2>0, y>0) 


que corresponde ao semi-círculo superior de centro na origem e raio 1, com condições de fronteira: 
u(x,0)=0, —I<a<al, u(z,y) = 100, 2 +y=1, 


cuja solução analítica é: 


400 A 1 qr 
u(r,0) = E 2 D] (5) sen(2n — 1)0. 
Obter a discretização desse problema em coordenadas polares com ôr = 0.1, do = 1/10. Usar MATLAB 
para resolver o sistema linear resultante. 


13.32 A fórmula de 5 pontos é de ordem O(h2). Se porventura necessitarmos de uma fórmula mais 
precisa para discretizar a equação de Laplace, devemos utilizar mais pontos. Mostre que uma fórmula de 
ordem O(hº) pode ser obtida utilizando-se os pontos da molécula abaixo: 


e ela é dada por: 


Uo —U7 + 16U3 + 160, — Us — Us + Us + 16U4 — Us) 


1 
= 5 

60 
No entanto essa fórmula não pode ser aplicada para pontos próximos à fronteira, pois ela utiliza dois 
pontos em cada direção. Poder-se-ia utilizar a molécula de cálculo: 
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para deduzir o esquema numérico, que também é de ordem O(h?). 


a 
“20 


Mostre que no caso da equação de Poisson o esquema (13.99) transforma-se em: 


Uo (AU, + U2 + Us + U4) + Us + Us + U7 + Us). (13.99) 


h2 
4 (U1 + U2 + Us + Us) + U5 + Us + Uy + Us — 2009 = z Sfo t fit fa + fa + fa). 
Calcule o ETL em todos os casos. 


13.33 Considere a numeração “red-black” como na figura abaixo: 


Figura 4.9: Numeração “red-black” 


Obtenha a matriz do sistema linear resultante. Generalize esse resultado para uma malha com N pontos 
na direção x e M pontos na direção y. 


13.34 4 equação biharmônica é dada por: 


AAU = Uzara + 2Uzzyy + Uyyyy = f(x,y). 
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Aproximando o operador AAu por: 
4 8 12 
Aus aoUo +) Uta) Ui+as) Ui 
i=1 i=5 i=9 


numa malha uniformente espaçada de h, obtenha valores para os parâmetros ao, œ1,œ2 e az tal que a 
fórmula tenha ordem O(h2). Deduza a fórmula do ETL. A molécula computacional é dada na figura: 


Figura 4.9: Molécula de cálculo para a equação biharmônica. 


13.35 Considere o problema elíptico: 


2 C + = (wen) = f(x,y) 


com condição de Dirichlet sobre a fronteira de um retângulo. Mostre que a matriz resultante da discre- 


tização de 5 pontos é simétrica. 


13.36 Mostre que 
AsV (x,y) = EAsV(x,y) + No > 0. 


13.37 Obtenha os demais elementos do vetor c do exemplo (13.9.1). 


13.38 Mostre que a discretização de 5 pontos da equação de Poisson para a molécula da figura 4.9 é 


dada por: 


agUo + &1U1 + &2U2 + &3U3 + agUs = fo 


onde os coeficientes œ são dados por: 


1 1 2 2 
= naa E a E 
a (G fo =) ari “O ndo 


2 2 
%3 = to “T halhz + ha)” 


CAPÍTULO 13. SOLUÇÃO NUMÉRICA DE EQUAÇÕES DIFERENCIAIS PARCIAIS 485 


Figura 4.9: Molécula de Cálculo para a discretização de 5 pontos em pontos não igualmente espaçados. 
Calcule o erro de truncamento local e determine a ordem de consistência dessa discretização. Mostre 
que quando hı = h3 = h e hə = h4 = k essa discretização é de ordem O(h? + k2). Explique como essa 


molécula pode ser utilizada para discretizar a equação de Poisson num domínio geral. 


13.39 Utilizar a técnica derivada no exercício anterior para aproximar a solução do problema do 


exercício (13.51) na malha da figura abaixo. 


Utilizar MATLAB na solução do sistema linear. 

13.40 Considere o caso 4x4 da matriz Ap de (2?). Utilizando MATLAB calcule os autovalores de Ap. 
Resolva agora o sistema linear resultante pelo método de Jacobi, também utilizando MATLAB e confirme 
que a taxa de convergência desse método é cerca de 0.5. Repita esse mesmo exercício para Gauss-Seidel. 


Capítulo 14 


Exercícios Mistos 


14.1 - Mostre que o método de Jacobi diverge para todos os valores de a que tornam a matriz a 


20 3 1 
A= a 20 1 
1 a 6 


positiva definida . 


14.2 - Dada uma função f(x), deseja -se calcular: 
b 


a) interpolar f(x) em n+1 pontos por um polinômio de grau n e integrá -lo, 


Para isso foram propostos dois métodos: 


b) aproximar f(x), usando o método dos mínimos quadrados, por uma função F(x) e integrá - 
la. 


Usar estes dois métodos para estimar: 


1 
I EE 
o 2 +37 +2 
comn=4 e F(x)=ay+ax+ azx2. Compare seus resultados com o valor exato que é Ing. 


14.3 - Para a duplicação de uma avenida, um estudo de engenharia de transportes necessita do cálculo 
do número total de veículos que passam pela avenida em um período de 24 horas. Um engenheiro vai ao 
local várias vezes durante um período de 24 horas, e conta o número de carros, por minuto, que passam 
pela avenida. Os dados obtidos pelo engenheiro encontram-se na tabela a seguir: 


486 
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Hora Carros/min Hora Carros/min 
0:00 2 12:80 15 
2:00 2 14:00 7 
4:00 0 16:00 9 
5:00 2 17:00 20 
6:00 5 18:00 22 
7:00 8 19:00 10 
8:00 20 20:00 11 
9:00 12 21:00 8 

10:80 5 22:00 5 

11:30 10 23:00 5 

0:00 3 


a) Usando interpolação linear estime quantos carros, por minuto, passaram pela avenida às 10:15 


horas. 


b) Usando os dados acima e uma fórmula de quadratura adequada, estime o número de carros 
que passam pela avenida por dia. (Cuidado com as unidades!). 
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